fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

Imagen 3 : Le générateur d’images de Google maintenant accessible au grand public

Imagen 3 : Le générateur d’images de Google maintenant accessible au grand public

En mai dernier, Google a dévoilé pour la première fois Imagen 3, son générateur d’images à partir de texte. Initialement réservé à la plateforme de développement Vertex AI et à une preview privée, cet outil restait hors de portée pour le grand public. Heureusement, la situation vient de changer.

Le géant de la recherche a discrètement annoncé que Imagen 3 est désormais accessible à tous les utilisateurs aux États-Unis, comme le rapporte VentureBeat. Vous pouvez essayer ce générateur d’images mis à jour via l’AI Test Kitchen de Google.

Google affirme que Imagen 3 est son générateur d’images le plus performant à ce jour. L’entreprise met en avant des images générées avec une meilleure précision, une richesse accrue au niveau de l’éclairage, et une réduction des artefacts. De plus, la compréhension des consignes textuelles a été « considérablement améliorée », ce qui permet à Imagen 3 de produire des résultats plus fidèles aux descriptions fournies.

Par ailleurs, Google indique que plusieurs versions de Imagen 3 seront proposées, chacune étant optimisée pour des tâches spécifiques, comme la création de croquis rapides ou la génération d’images en haute résolution.

Imagen 3 alimente également la nouvelle application Pixel Studio disponible sur les téléphones de la série Pixel 9. Cette application permet non seulement de générer des images à partir de texte, mais aussi d’éditer des photos grâce à une intelligence artificielle intégrée au dispositif. Cependant, il n’est pas nécessaire d’acheter un téléphone Pixel 9 pour essayer Imagen 3. L’accès est élargi, offrant ainsi au public la possibilité de découvrir cette technologie prometteuse sans condition restrictive.

Imagen 3 contraste fortement avec Grok

Malgré quelques restrictions peu souples, Imagen 3 contraste fortement avec Grok, le générateur d’images par IA qui vit sur la plateforme X d’Elon Musk. Grok a été utilisé pour générer toutes sortes de contenus sauvages, y compris des images contenant de la drogue, de la violence et des personnalités publiques faisant des choses douteuses.

Mais les outils d’IA de Google ont également connu quelques problèmes. Au début de l’année, Google a cessé de laisser les gens générer des images avec son chatbot Gemini après que des utilisateurs ont constaté qu’il créait des images historiquement inexactes.

Lire plus
Intelligence Artificielle

Ideogram 2.0 éclipse Midjourney avec des images IA plus réalistes et personnalisables

Ideogram 2.0 éclipse Midjourney avec des images IA plus réalistes et personnalisables

L’introduction de Ideogram 2.0 fait monter d’un cran les enjeux des générateurs d’images IA, d’autant plus que Midjourney vient d’annoncer une mise à jour invitant davantage d’utilisateurs à rejoindre sa plateforme.

Midjourney et DALL-E ne manqueront pas de s’intéresser au dernier modèle de leur rival, qui arrive tout juste un an après leur arrivée sur la scène de l’IA. Il est évident que Ideogram a placé la barre très haut.

La nouvelle version offre un large éventail d’options personnalisables, y compris le choix de la couleur et du style de l’image générée, présentée dans l’un des cinq thèmes uniques : Général, Réaliste, Design, 3D et Anime.

Ideogram 2.0 prête attention aux détails les plus fins du prompt, notamment en ce qui concerne les visages, les yeux et les doigts, ce qui était une caractéristique peu satisfaisante de la version précédente. Il s’agit d’une amélioration bienvenue, mais ce n’est que l’un des aspects d’une offre considérablement améliorée.

Un autre point positif pour Ideogram est le réalisme des images générées.

Une application iOS, une API et une fonction de recherche visuelle pour Ideogram 2.0

La version 1.0 a toujours respecté les spécifications de conception, mais avec la version Ideogram 2.0, non seulement les humains sont représentés de manière plus réaliste, mais les résultats sont également meilleurs pour les objets et les lieux. Cela se rapproche du domaine de Midjourney et de Flux, mais dans un espace d’images d’IA en pleine évolution, Midjourney est plus que digne d’une place sur la liste des fournisseurs AAA.

L’accélération d’Ideogram ne s’arrête pas à la nouvelle fonctionnalité créative, l’entreprise ajoute également une application iOS, une API et une fonction de recherche visuelle.

GVg72N W4AAiFdc jpg

Tout cela se produit la même semaine que le lancement de Grok-2 et la nouvelle mise à jour de Midjourney qui permet aux utilisateurs d’accéder à un essai gratuit limité pour générer 25 images avant qu’un abonnement ne soit nécessaire.

Quelle est la gamme d’abonnements proposée par Ideogram ?

Ideogram propose différents niveaux d’abonnement, dont une version gratuite accessible et abondante. Ce niveau est idéal pour une utilisation légère ou occasionnelle, offrant jusqu’à 40 images générées par jour sans frais. Vient ensuite l’abonnement Basic, qui offre 400 images prioritaires par mois (et 100 images lentes par jour) ainsi que d’autres avantages pour 7 dollars.

L’abonnement Plus passe au niveau supérieur avec 1000 crédits prioritaires et un nombre illimité de générations lentes par mois pour le prix de 16 dollars, tandis que l’abonnement Pro, au niveau le plus élevé, offre 4000 images rapides.

Lire plus
Intelligence Artificielle

Midjourney ouvre son site Web à tous : Essai gratuit et nouvelles fonctionnalités

Midjourney ouvre son site Web à tous : Essai gratuit et nouvelles fonctionnalités

Midjourney, le célèbre service de génération d’images par IA, a récemment ouvert son site Web à tous les utilisateurs, après avoir été principalement confiné à Discord et à une phase « alpha » limitée.

Désormais, même ceux qui ne sont pas encore inscrits peuvent accéder à la plateforme et bénéficier d’un essai gratuit leur permettant de générer environ 25 images, comme l’a indiqué le cofondateur et PDG de Midjourney, David Holz, sur Discord.

Cette ouverture marque une étape importante pour Midjourney, rendant la plateforme plus accessible et permettant à un public plus large d’explorer ses capacités sans engagement financier immédiat. Les nouveaux utilisateurs peuvent s’inscrire via un compte Google ou Discord, simplifiant ainsi le processus d’inscription.

Fonctionnalités du site Web de Midjourney

Une fois connectés, les utilisateurs peuvent créer des images en saisissant des descriptions textuelles dans un champ prévu à cet effet. Le site génère ensuite un ensemble de quatre images, que l’utilisateur peut ajuster en fonction de plusieurs paramètres, comme le ratio d’aspect, le degré de stylisation, ou encore la variation entre les images. Ces réglages se font via un menu pop-up accessible en cliquant sur l’icône à droite du champ de texte.

Screen 2024 08 22 16.40.27 jpg

Sur la gauche de la page, un menu de navigation permet d’accéder à différentes sections du site, y compris un onglet « Organiser » pour visualiser les images générées précédemment, et un onglet « Chat » pour échanger avec d’autres utilisateurs.

Screen 2024 08 22 16.41.14 scaled

Options pour les utilisateurs existants

Les utilisateurs de longue date, qui ont généré des images via Discord, peuvent se connecter au site en utilisant leur compte Discord pour conserver l’historique de leurs créations. Une option de fusion de comptes (Discord et Google) est également disponible, offrant une plus grande flexibilité pour se connecter à l’avenir.

Contexte concurrentiel et juridique

L’ouverture du site intervient à un moment où Midjourney, considéré comme la référence en matière de génération d’images par IA, fait face à une concurrence accrue. Des entreprises comme xAI d’Elon Musk et Ideogram 2 lancent de nouveaux outils similaires, intensifiant la compétition dans ce secteur en pleine expansion. Par ailleurs, Midjourney doit également faire face à une poursuite judiciaire intentée par des artistes qui l’accusent d’utiliser leurs œuvres protégées par des droits d’auteur pour entraîner ses modèles, sans autorisation ni compensation.

En ouvrant son site Web à un plus large public et en proposant des essais gratuits, Midjourney espère attirer un éventail diversifié d’utilisateurs, des créateurs occasionnels aux artistes plus sérieux. Cette stratégie pourrait non seulement élargir sa base d’utilisateurs, mais aussi accroître l’engagement sur la plateforme, renforçant ainsi sa position face à une concurrence croissante.

Lire plus
Intelligence Artificielle

Condé Nast signe un partenariat avec OpenAI pour intégrer son contenu dans ChatGPT

Condé Nast signe un partenariat avec OpenAI pour intégrer son contenu dans ChatGPT

Condé Nast a officiellement signé un accord avec OpenAI et devient le dernier en date une liste d’entreprises de médias, bien que d’autres éditeurs aient poursuivi l’entreprise technologique en justice.

Le nouveau partenariat signifie que le contenu des marques de Condé Nast (Vogue, GQ, The New Yorker, Bon Appétit, Vanity Fair, Wired, Condé Nast Traveler, Architectural Digest, et bien d’autres encore) sera affiché dans les produits d’OpenAI. Cela comprendra ChatGPT et le prototype SearchGPT.

« Nous nous engageons à travailler avec Condé Nast et d’autres éditeurs de presse pour nous assurer qu’à mesure que l’IA joue un rôle plus important dans la découverte et la diffusion des informations, elle maintient l’exactitude, l’intégrité et le respect des reportages de qualité », a déclaré Brad Lightcap, directeur de l’exploitation d’OpenAI.

Le nouveau prototype de SearchGPT est actuellement testé pour rendre la recherche d’informations et de sources de contenu fiables « plus rapide et plus intuitive ».

Avec cet accord en poche, le prototype peut offrir des liens directs vers des articles d’actualité provenant du contenu détenu par la société mère de Vogue. Ces fonctions de recherche seront ensuite intégrées directement dans ChatGPT.

Tous les détails ne sont pas encore connus, mais il s’agit d’un partenariat pluriannuel. « OpenAI a montré qu’elle était également très engagée dans cette mission », déclare le PDG de Condé Nast.

Un partenariat pluriannuel entre Condé Nast et OpenAI 

Le PDG de Condé Nast, Roger Lynch, a annoncé la nouvelle par le biais d’un mémo interne à l’entreprise : « Je suis heureux de vous annoncer que nous avons conclu un partenariat pluriannuel avec OpenAI afin d’étendre la portée du contenu de Condé Nast ».

« Comme nous le savons tous, l’IA générative change rapidement la façon dont les publics découvrent l’information. Il est essentiel que nous rencontrions les publics là où ils se trouvent et que nous adoptions les nouvelles technologies tout en garantissant une attribution et une compensation appropriées pour l’utilisation de notre propriété intellectuelle. C’est exactement ce que nous avons trouvé avec OpenAI ».

Il ajoute que OpenAI a montré qu’elle était elle aussi engagée dans cette mission, la décrivant comme « transparente » et « désireuse de travailler de manière productive avec des éditeurs comme nous afin que le public puisse recevoir des informations fiables… ».

Le nouvel accord de OpenAI intervient dans un contexte de poursuites judiciaires de la part d’autres éditeurs

D’autres éditeurs ont également signé un accord avec la société basée à San Francisco, notamment Associated Press, Axel Springer, The Atlantic, Dotdash Meredith, Financial Times, LeMonde, NewsCorp, Prisa Media, TIME, Vox Media et bien d’autres encore. Cependant, tout le monde n’est pas heureux d’être associé à la société, car OpenAI a fait l’objet de plusieurs poursuites judiciaires depuis sa création.

Le New York Times et 8 autres journaux poursuivent l’entreprise pour violation des droits d’auteur, car leur contenu aurait été utilisé pour entraîner le modèle.

Lire plus
Intelligence Artificielle

GPT-4o fine-tuning : Une révolution pour la personnalisation de l’IA

GPT-4o fine-tuning : Une révolution pour la personnalisation de l’IA

Le 20 août 2024, OpenAI a marqué une avancée majeure dans le domaine de l’intelligence artificielle en annonçant la possibilité de fine-tuning pour GPT-4o. Cette fonctionnalité permet désormais aux entreprises de personnaliser ce modèle selon leurs besoins spécifiques, offrant un contrôle inédit sur les réponses générées et une adaptation à des instructions complexes et spécifiques à divers domaines.

Cette innovation est sur le point de révolutionner l’intégration de l’IA dans les entreprises, en leur offrant une personnalisation sans précédent.

Un tournant pour la personnalisation dans l’industrie

Le fine-tuning de GPT-4o représente un véritable tournant pour les industries cherchant à exploiter pleinement le potentiel de l’IA. Selon Andrew Peng, l’un des auteurs de l’annonce, « du codage à l’écriture créative, le fine-tuning peut avoir un impact significatif sur la performance du modèle dans une variété de domaines ». Grâce à cette personnalisation, les entreprises peuvent maintenant ajuster l’IA pour répondre à leurs exigences uniques, améliorant ainsi des domaines aussi variés que le service client ou l’assistance technique.

Coûts et accessibilité

Bien que les avantages soient indéniables, le fine-tuning a un coût. OpenAI a fixé un prix de 25 dollars par million de tokens pour le fine-tuning, avec des frais supplémentaires pour le traitement. Pour rendre cette technologie plus accessible, OpenAI offre quotidiennement 1 million de tokens de formation gratuits jusqu’au 23 septembre 2024, encourageant ainsi un large éventail d’entreprises à explorer ce puissant outil.

En parallèle au modèle GPT-4o principal, OpenAI a introduit le fine-tuning pour GPT-4o mini, une version plus abordable. Cette démarche s’inscrit dans la mission plus large d’OpenAI de démocratiser l’IA, en rendant les technologies avancées accessibles même aux petites entreprises et startups.

Réactions de l’industrie et de la communauté

L’annonce a suscité un vif intérêt au sein de la communauté technologique. Rachel Metz, journaliste spécialisée en technologie, a commenté : « Cela pourrait changer la donne pour les entreprises hésitantes à adopter l’IA. La capacité de fine-tuning d’un modèle comme GPT-4o pour des cas d’utilisation spécifiques le rend bien plus pertinent et utile ». Cette déclaration reflète l’enthousiasme suscité par le potentiel du fine-tuning pour améliorer l’intégration de l’IA dans diverses opérations commerciales.

Cependant, des préoccupations concernant la confidentialité des données et la sécurité ont également émergé. OpenAI a assuré que les modèles fine-tunés restent sous le contrôle total des entreprises, avec une gestion sécurisée de toutes les données. L’entreprise a mis en place des mesures de sécurité robustes, incluant des évaluations de sécurité automatisées et une surveillance de l’utilisation pour prévenir tout abus de la technologie.

Les risques de la personnalisation

Si le fine-tuning présente de nombreux avantages, il comporte aussi certains risques. Des rapports ont évoqué la possibilité que le fine-tuning puisse amener les modèles à s’écarter de leurs garde-fous initiaux, compromettant potentiellement leur performance. Malgré ces préoccupations, OpenAI reste optimiste quant à l’impact positif de la personnalisation, invitant les entreprises à envisager le potentiel du fine-tuning dans leurs stratégies d’IA.

Dans un contexte de concurrence accrue dans le secteur de l’IA, la décision d’OpenAI d’activer le fine-tuning sur GPT-4o renforce sa position de leader. En élargissant les options de personnalisation du modèle, OpenAI ouvre la voie à une intégration plus fluide de l’IA dans un large éventail d’opérations commerciales, offrant des solutions sur mesure qui étaient auparavant inimaginables.

Un nouveau standard dans la technologie de l’IA

Le fine-tuning de GPT-4o par OpenAI constitue un jalon crucial dans la technologie de l’IA, ouvrant de nouvelles possibilités pour l’innovation et l’efficacité dans divers secteurs. Au fur et à mesure que cette technologie évolue, il sera fascinant d’observer comment les entreprises utiliseront le fine-tuning pour repousser les limites de ce que l’IA peut accomplir.

L’introduction du fine-tuning pour GPT-4o présente plusieurs impacts significatifs pour les entreprises :

  • Avantage concurrentiel accru : Les entreprises peuvent désormais aligner les modèles d’IA sur leurs besoins spécifiques, conduisant à des applications plus précises et efficaces, du service client aux recommandations de produits.
  • Considérations de coût : Bien que bénéfique, le coût associé au fine-tuning pourrait être prohibitif pour les petites entreprises, nécessitant une évaluation minutieuse du retour sur investissement.
  • Confidentialité et sécurité des données : Le fine-tuning permet aux entreprises de conserver un contrôle total sur leurs données, ce qui est crucial dans les secteurs où la confidentialité est primordiale. Cependant, une vigilance accrue est nécessaire pour s’assurer que les modèles fine-tunés ne compromettent pas la sécurité ou n’introduisent pas de biais.
  • Adoption accrue de l’IA : La disponibilité du fine-tuning pourrait accélérer l’adoption de l’IA dans divers secteurs, rendant les outils d’IA plus pertinents et favorisant une intégration plus large dans les stratégies d’affaires.

Implications juridiques

Le paysage juridique entourant la personnalisation de l’IA est complexe :

  • Confidentialité et propriété des données : Les entreprises doivent s’assurer de leur conformité avec les réglementations sur la protection des données telles que le RGPD et le CCPA, car toute violation pourrait entraîner des sanctions sévères.
  • Droits de propriété intellectuelle : La personnalisation soulève des questions sur la propriété intellectuelle. Des conditions claires avec OpenAI concernant les droits de propriété intellectuelle sont essentielles pour éviter les litiges.
  • Responsabilité et responsabilité : À mesure que l’IA devient intégrée aux opérations, déterminer la responsabilité en cas d’erreurs devient complexe. Les entreprises doivent envisager des clauses de responsabilité et une couverture d’assurance liée à l’IA.
  • Conformité aux réglementations sectorielles : Les secteurs comme la finance et la santé doivent s’assurer que l’utilisation des modèles d’IA fine-tunés est conforme aux réglementations en vigueur. La transparence et la capacité d’audit des processus décisionnels de l’IA sont cruciales.
  • Considérations éthiques et biais : Les entreprises doivent surveiller les modèles fine-tunés pour détecter les biais, en abordant les défis juridiques liés aux décisions biaisées de l’IA.

En somme, l’introduction du fine-tuning pour GPT-4o ouvre de vastes perspectives, mais elle requiert une approche réfléchie pour en maximiser les bénéfices tout en minimisant les risques.

Lire plus
Intelligence Artificielle

Apple Intelligence : Siri en retard, mais une révolution IA en marche

Apple Intelligence : Siri en retard, mais une révolution IA en marche

Apple Intelligence arrive cet automne, mais selon Mark Gurman, la firme a beaucoup de retard à rattraper. Pendant ce temps, Apple semble vouloir se lancer dans la robotique avec un robot iPad alimenté par l’IA.

Lors de la dernière WWDC (Worldwide Developers Conference) d’Apple, Apple Intelligence a été l’un des sujets majeurs. Après des années de performances risibles de Siri, Apple cherche à revoir entièrement son modèle avec une IA moderne. Siri, autrefois pionnier dans le domaine des assistants vocaux, a peu à peu perdu du terrain face à des concurrents comme Google Assistant et Amazon Alexa. La refonte promise par Apple avec Apple Intelligence est donc une tentative de revenir dans la course.

Cependant, Gurman estime que l’offre d’Apple est loin d’égaler celle de Google, qui a récemment impressionné avec Gemini sur le Pixel 9. Ce dernier intègre des fonctionnalités avancées comme la possibilité de changer l’arrière-plan d’une photo en un clin d’œil, un niveau d’intelligence artificielle que la deuxième bêta d’iOS 18.1 semble encore loin d’atteindre.

Apple Intelligence : Une révolution pour Siri ?

Malgré ces critiques, Apple Intelligence apporte des innovations attendues depuis longtemps par les utilisateurs d’iPhone. Siri, qui semblait être délaissé au fil des années, pourrait enfin devenir l’assistant vocal rêvé par les utilisateurs, avec des performances à la hauteur des attentes. La communauté Apple espère que cette refonte permettra à Siri de rattraper son retard sur ses concurrents.

Apple est connu pour ne jamais abandonner une nouvelle catégorie, même si ses premières tentatives ne sont pas les meilleures du marché. À l’instar de l’Apple Vision Pro, Apple continuera probablement d’améliorer son modèle d’IA, même si Apple Intelligence n’est pas immédiatement au niveau des attentes. Il est également à noter que la société travaillerait déjà sur une Vision Pro 2, ce qui laisse entendre qu’Apple s’engage à long terme dans ces nouvelles technologies.

Des futurs projets : L’IA et la robotique

L’autre aspect fascinant est la volonté d’Apple de se lancer dans la robotique, un domaine où l’IA pourrait jouer un rôle crucial. Un robot iPad, piloté par Apple Intelligence, pourrait révolutionner l’interaction utilisateur en combinant les puissantes capacités des puces de série M d’Apple avec une intelligence artificielle de pointe. Ces puces, qui ont transformé les performances des Mac, montrent qu’Apple est capable de dépasser les attentes lorsqu’il se consacre pleinement à un projet.

Bien que Gurman pense qu’Apple est en retard sur Google en matière d’IA, il est important de rappeler que ce n’est pas la première fois qu’Apple prend du temps pour atteindre l’excellence dans un domaine. La firme a souvent montré qu’elle pouvait rattraper et dépasser ses concurrents, notamment avec les puces Apple M qui ont révolutionné les Mac. Si Apple se lance vraiment dans la robotique avec un robot iPad alimenté par l’IA, cela pourrait bien être le signe de plans grandioses pour Apple Intelligence.

Le pari est donc lancé : Apple parviendra-t-il à transformer son assistant vocal en une véritable intelligence artificielle capable de rivaliser avec les meilleurs du marché ? Les prochains mois s’annoncent décisifs pour le géant de Cupertino.

Lire plus
Intelligence Artificielle

OpenAI prépare le lancement du projet Strawberry : GPT-5 en vue ?

OpenAI prépare le lancement du projet Strawberry : GPT-5 en vue ?

Le mois dernier, Reuters a rapporté que le créateur de ChatGPT, OpenAI, travaillait sur un projet dont le nom de code est « Strawberry ». Des documents internes examinés par la publication montrent que le projet Strawberry vise à permettre à l’IA d’effectuer des « recherches approfondies » de manière autonome sur le Web. Interrogé sur le projet, le porte-parole de OpenAI a déclaré que « ces systèmes amélioreront leur raisonnement au fil du temps ».

Qu’est-ce que le projet Strawberry et qu’est-ce que OpenAI est en train de cuisiner ? S’agit-il du prochain modèle GPT-5, alias ChatGPT 5 ?

Le projet Strawberry expliqué

Le projet Strawberry serait lié à Q* — la prochaine percée dans le développement de l’IA, selon des membres du personnel d’OpenAI au sein de l’entreprise. Il n’y a pas beaucoup d’informations sur Q* dans le domaine public. Toutefois, des sources ayant visionné la démo affirment qu’il est capable de résoudre des questions scientifiques et mathématiques qu’aucun autre modèle actuel n’est en mesure de résoudre.

Il a obtenu un score de plus de 90 % sur un ensemble de données MATH, une référence rigoureuse pour tester les compétences en matière de problèmes mathématiques. Bloomberg a récemment rapporté que OpenAI avait organisé une démonstration interne, au cours de laquelle elle a présenté un projet de recherche qui mettait en évidence un raisonnement semblable à celui de l’homme. OpenAI a également présenté différents niveaux de progrès en matière d’IA, que nous avons décrits dans notre explication de l’AGI, et qui sont les suivants :

  • Niveau 1 : IA conversationnelle — Peut discuter comme les humains en langage naturel
  • Niveau 2 : IA raisonnante — Peut raisonner comme les humains en faisant preuve d’intelligence
  • Niveau 3 : IA autonome — Effectue des actions de manière autonome
  • Niveau 4 : IA innovante — Elle innove et s’améliore.
  • Niveau 5 : IA organisationnelle — Effectue des actions et accomplit des tâches pour l’ensemble d’une organisation.

Beaucoup pensent qu’avec le projet Strawberry, OpenAI a atteint le niveau 2, où les systèmes d’IA peuvent raisonner intelligemment comme les humains. Le rapport de Reuters suggère que le projet Strawberry comprend une méthode de post-entraînement où le modèle est entraîné d’une manière spécifique, similaire à un réglage fin.

Cette technique spécifique de post-entraînement est très similaire à Self-Taught Reasoner ou STaR (arXiv), une méthode de chaîne de pensée, proposée par des chercheurs de Stanford en 2022. Elle vise à améliorer les performances du modèle « sur des tâches de raisonnement complexes comme les mathématiques ou la réponse à des questions de bon sens » en « générant pas à pas des raisonnements “en chaîne de pensée” ».

En termes simples, STaR permet au modèle de s’améliorer en apprenant de ses propres raisonnements. Il semble qu’OpenAI utilise probablement la technique STaR pour le projet Strawberry afin d’imiter le raisonnement humain et de résoudre des problèmes mathématiques difficiles.

Le projet Strawberry n’est pas seulement limité au raisonnement avancé, il peut également effectuer ce que l’on appelle des tâches à long terme (LHT), selon des documents consultés par Reuters. En gros, il peut aussi agir comme un agent et naviguer sur le Web de manière autonome, aboutir à des conclusions, planifier et exécuter une série d’actions.

Le cas curieux du projet Strawberry sur X

Le 7 août, le PDG d’OpenAI, Sam Altman, a partagé une image de fraise qui a suscité l’enthousiasme et la curiosité de la communauté. Le lendemain, un compte X (@iruletheworldmo), supposé être un membre du personnel d’OpenAI, a tweeté « bienvenue au niveau deux. comment vous sentez-vous ? est-ce que je vous ai fait sentir ? » Altman a commenté, « incroyable tbh ».

Suite à cela, une vague de messages énigmatiques liés à la fraise a été partagée par des employés de OpenAI sur X. La plupart des messages font allusion au niveau 2, c’est-à-dire à la capacité de raisonnement avancée, et au projet Strawberry.

ChatGPT 5 est-il enfin disponible ?

En regardant le développement jusqu’à présent, il semble que OpenAI se prépare à sortir le prochain modèle frontière très bientôt. Alimenté par le projet Strawberry, le modèle frontière est susceptible d’apporter une capacité de raisonnement avancée et de débloquer des workflows agentiques. Nous ne savons pas s’il s’appellera GPT-5 ou autre chose. Sam Altman a déjà déclaré que le successeur du modèle GPT-4 pourrait ne pas s’appeler GPT-5.

En outre, plus d’un an s’est écoulé depuis la sortie de GPT-4. Entre-temps, Anthropic et Google ont presque détrôné OpenAI avec leurs mises à jour itératives. En mai 2024, Mira Murati, directrice technique d’OpenAI, a déclaré que le prochain grand projet verrait le jour en 2024. Le lancement semble donc imminent. Êtes-vous prêts ?

Lire plus
Intelligence Artificielle

OpenAI acquiert Multi : Renforcement des capacités de collaboration vidéo

3QoIJiw9cgCCDzhvxAaCxtdw80w

OpenAI poursuit son expansion dans le secteur des technologies d’entreprise en annonçant l’acquisition de Multi, une startup spécialisée dans les plateformes de collaboration vidéo.

Quelques jours après l’achat de Rockset, une entreprise technologique de bases de données, OpenAI confirme l’intégration de Multi. Selon une source proche du dossier, cette transaction est essentiellement un acquihire, avec l’intégration de la majorité de l’équipe de Multi, composée d’environ 5 personnes, au sein d’OpenAI.

Alexander Embiricos, PDG et co-fondateur de Multi, a annoncé que Multi cessera ses activités après le 24 juillet 2024. « Nous sommes extrêmement enthousiastes à l’idée de rejoindre OpenAI », a-t-il écrit dans un article de blog sur le site de Multi. « Merci à tous ceux qui ont utilisé Multi. Ce fut un privilège de construire avec vous, et nous avons énormément appris de vous ».

Embiricos, ancien chef de produit chez Dropbox, et Charley Ho, co-fondateur de Multi et ancien ingénieur logiciel chez Google, avaient pour ambition de créer une plateforme de collaboration vidéo basée sur Zoom pour les équipes à distance. Multi proposait des fonctionnalités telles que la collaboration par des partages d’écran simultanés pour jusqu’à 10 personnes, des raccourcis personnalisables et des liens profonds automatiques pour le code, les designs et les documents.

L’annonce comporte de mauvaises nouvelles pour les clients existants, Multi cessant d’exister le mois prochain :

Malheureusement, cela signifie que nous mettons fin à Multi. Nous avons fermé les inscriptions de nouvelles équipes, et les équipes actuellement actives pourront utiliser l’application jusqu’au 24 juillet 2024, après quoi nous supprimerons toutes les données des utilisateurs. Si vous avez besoin d’aide ou de temps pour trouver une solution de remplacement, envoyez un courriel à [email protected]. Nous serons heureux de vous suggérer des alternatives en fonction de ce que vous aimiez exactement dans Multi, et nous pouvons également accorder des extensions au cas par cas.

Une stratégie à long terme pour OpenAI

Tout comme l’acquisition de Rockset, l’acquisition de Multi s’inscrit dans la stratégie récente d’OpenAI d’investir massivement dans les solutions d’entreprise. OpenAI a récemment annoncé que la version entreprise de sa plateforme de chatbot alimentée par l’IA, ChatGPT, comptait près de 600 000 utilisateurs, dont 93 % des entreprises du Fortune 500.

À l’instar des autres efforts de développement de produits destinés aux entreprises, pourrait-on un jour voir une version améliorée de ChatGPT avec des capacités de vidéoconférence et de collaboration à distance ? Peut-être. Il ne serait pas surprenant qu’OpenAI poursuive dans cette voie.

Lire plus
Intelligence Artificielle

Pixel Studio : Créez des images d’IA avec Imagen 3 sur votre Pixel 9

Pixel Studio : Créez des images d’IA avec Imagen 3 sur votre Pixel 9

Alors que la gamme de smartphones Pixel 9 a été le point fort de l’événement Made by Google d’hier, l’entreprise a également annoncé une nouvelle application pour créer des images d’IA. Baptisée Pixel Studio, l’application utilise le modèle Imagen 3 de Google pour transformer des prompts textuels en images.

Au-delà de la création d’images de base, l’application propose des outils d’édition IA sur l’appareil qui permettent de repositionner ou d’effacer des objets dans le cadre. Elle suggère également des styles artistiques, tels que le cinéma ou l’animation, en fonction de l’invite.

La plupart des meilleurs générateurs d’images d’IA sont soumis à un abonnement mensuel onéreux. Cependant, avec Pixel Studio, vous n’aurez pas à payer pour la fonctionnalité au-delà du coût initial de possession d’un appareil de la série Pixel 9. On ne sait pas si l’application fera son apparition sur les anciens appareils Pixel.

Pixel Studio utilise le modèle Imagen 3 de Google sous le capot. Comme Midjourney et d’autres générateurs d’images par IA, Imagen 3 s’appuie sur une technologie d’apprentissage automatique appelée diffusion qui lui permet de convertir des invites textuelles en images.

Bien qu’un générateur d’images sur l’appareil semble impressionnant, il convient de noter que même le dernier SoC Tensor G4 de Google ne peut pas rivaliser avec la puissance de traitement d’un matériel d’IA dédié fonctionnant dans le cloud. C’est pourquoi la génération d’images proprement dite nécessite toujours Imagen 3 et seul un modèle plus petit sur l’appareil gère les modifications après coup, de la même manière que Gemini Nano est réduit par rapport à ses homologues plus grands.

Outre Pixel Studio, des améliorations à la surcouche Gemini

Vous pouvez toujours créer des images générées par l’IA sur les anciens appareils Pixel ou d’autres appareils Android via la surcouche Gemini sur mobile. Il suffit de demander au chatbot de générer une image. Cette fonctionnalité est disponible depuis un certain temps déjà, mais elle nécessite une connexion Internet et ne produira pas de résultats aussi rapidement que la nouvelle application Pixel Studio.

L’interface du chatbot n’offre pas non plus de fonctions d’édition une fois qu’un ensemble d’images a été généré. Cependant, Google a également annoncé des améliorations à la surcouche Gemini, vous permettant de glisser-déposer des images générées par l’IA directement dans un e-mail ou un chat.

L’application Pixel Studio arrive quelques semaines après qu’Apple a annoncé son propre générateur d’images par IA pour l’iPhone. Baptisée Image Playground, l’application devrait arriver en même temps que d’autres fonctionnalités d’Apple Intelligence qui concurrencent d’autres aspects de Google Gemini. Image Playground d’Apple utilisera un modèle sur l’appareil pour générer des images hors ligne.

Lire plus
Intelligence Artificielle

Pixel Screenshots : L’IA transforme vos captures d’écran en archives personnelles

Pixel Screenshots : L’IA transforme vos captures d’écran en archives personnelles

L’IA sait comment faire un spectacle tape-à-l’œil, bien sûr, en générant des images réalistes à partir de rien (en apparence), mais ne vous laissez pas distraire par certaines de ses utilisations utilitaires toujours très cool. Nous avons vu comment l’IA peut vous aider à rédiger un courriel ou même à résumer un courriel que vous avez reçu, mais il est facile de travailler avec du texte. Qu’en est-il de la capacité de l’IA à extraire des données lisibles par machine à partir d’images, à organiser ces données et à les utiliser pour répondre à vos questions ? C’est exactement ce que Google fait avec la nouvelle famille Pixel 9, en vous permettant de préparer vos propres petites archives personnelles avec Pixel Screenshots.

Annoncée lors de l’événement Made by Google, Pixel Screenshots fait ses débuts en tant que toute nouvelle application sur les smartphones de la série Pixel 9. Nous entendons parler de travaux sur celle-ci depuis un certain temps, souvent en termes de comparaison avec la controversée fonctionnalité Recall de Microsoft.

Si vous optez pour son traitement IA, l’application analysera chaque capture d’écran que vous enregistrez avec votre téléphone. Elle le fait sur l’appareil grâce à la puissance de la nouvelle puce Tensor G4 de Google, ce qui devrait permettre d’atténuer certains problèmes de confidentialité. En effet, Pixel Screenshot utilise le modèle d’IA privé Gemini Nano de Google, installé sur l’appareil, pour analyser le contenu d’une image et le rendre consultable.

screenshot 2 jpg

Si vous êtes curieux de savoir ce que vous avez fait sur votre smartphone il y a plusieurs mois et que vous pensez avoir enregistré une capture d’écran pertinente au même moment, il vous suffira de demander à Gemini s’il peut faire le lien.

Vous obtiendrez non seulement une réponse directe à votre question, mais votre smartphone vous montrera également la capture d’écran spécifique qu’il utilise pour générer cette réponse – un bon moyen de vérifier si vous obtenez des résultats bizarres ou si vous souhaitez simplement obtenir plus de contexte.

screenshot 3 jpg

Pixel Screenshots sera uniquement disponible sur la série Pixel 9

Lors d’une démonstration à l’occasion du lancement du Pixel, Google a montré comment vous pouviez prendre une capture d’écran et l’enregistrer dans une collection, par exemple « idées de cadeaux ». Vous pouvez également effectuer une recherche parmi toutes vos autres captures d’écran en saisissant un mot clé, comme « vélos » ou « chaussures ». Pixel Screenshots affichera alors tous les résultats pertinents. En outre, Pixel Screenshots peut vous donner des informations sur ce qui se trouve à l’intérieur d’une image. Ainsi, si vous cherchez le prix d’une chemise que vous avez capturée, vous pouvez taper « prix t-shirt » et Pixel Screenshots extraira les informations de vos captures d’écran pour faire apparaître une réponse.

Si vous changez d’appareil et avez envie d’importer tout un tas d’anciennes captures d’écran, Pixel Screenshots sera également en mesure de les traiter, mais ce n’est pas le cas par défaut.

kiki desktop 2312x1158en US resized for kw

Bien sûr, pour tirer le meilleur parti de Pixel Screenshots, il faudra d’abord que vous preniez des captures d’écran – et ce n’est peut-être pas un comportement que nous avons tous déjà adopté. Mais une fois que vous aurez pris l’habitude de le faire, ce nouvel outil semble avoir le potentiel d’améliorer la façon dont vous accédez à vos propres informations.

Pour rappel, l’application ne sera disponible que sur les appareils Pixel 9.

Lire plus
Intelligence Artificielle

xAI dévoile Grok-2 et Grok-2 Mini : Des avancées majeures en IA avec génération d’images

xAI dévoile Grok-2 et Grok-2 Mini : Des avancées majeures en IA avec génération d’images

La société d’IA d’Elon Musk, xAi, a lancé Grok-2 et Grok-2 mini en mode bêta, les deux modèles devant être diffusés sur la plateforme de réseaux sociaux X. Pour la première fois, le nouveau modèle Grok permettra aux utilisateurs de générer des images et de les partager par le biais de leurs posts.

Grok-2 a étonnamment surpassé Claude, Gemini et même ChatGPT. L’ancien modèle Grok-1.5 n’a pas été bien accueilli, mais Grok-2 a réalisé d’excellentes performances au classement LMSYS. xAI a publié deux nouveaux modèles : Grok-2 et un modèle plus petit, Grok-2 mini.

xAI affirme que Grok-2 a été considérablement amélioré dans des domaines clés tels que le raisonnement, le suivi des instructions et la fourniture d’informations précises et factuelles. Dans les tests d’intelligence artificielle traditionnels, Grok-2 a obtenu un score impressionnant de 87,5 % en MMLU et de 88,4 % en HumanEval. Ces résultats sont d’autant plus intéressants que le score MMLU a été obtenu en utilisant le CoT à 0 coup.

Screen 2024 08 14 12.22.21 scaled
Screenshot

Grok-2 a été testé sur LMSYS sous le nom de « sus-column-r ». Avec environ 12 000 votes, il se trouve en troisième position, juste derrière ChatGPT-4o-latest, Gemini-1.5-Pro-Experimental et GPT-40-2024-05-13. Cependant, il est plus performant que GPT-4o-mini, Claude 3.5 Sonnet, Gemini 1.5 Pro, et Llama 3.1 405B.

Dans les tâches liées au codage et aux mathématiques, Grok-2 prend la deuxième place, et dans les invites difficiles, il prend la quatrième place.

Grok-2 et Grok-2 mini, deux modèles très attendus

« Grok-2 est notre modèle linguistique d’avant-garde, doté de capacités de raisonnement de pointe. Cette version comprend deux membres de la famille Grok : Grok-2 et Grok-2 mini », peut-on lire dans l’article de blog de xAI présentant le duo.

image 1 jpg

Selon toute vraisemblance, le générateur d’images a été rendu possible par la collaboration avec Black Forest Labs, car l’équipe déclare qu’elle expérimente le modèle FLUX.1 pour étendre les capacités du chatbot. Les éléments rendus possibles par FLUX.1 n’ont toutefois pas encore été confirmés. « Grok-2 est notre assistant IA de pointe avec des capacités avancées à la fois dans la compréhension du texte et de la vision, intégrant des informations en temps réel de la plateforme 𝕏, accessible via l’onglet Grok dans l’app 𝕏 ». « Grok-2 mini est notre modèle petit mais capable qui offre un équilibre entre la vitesse et la qualité des réponses. Par rapport à son prédécesseur, Grok-2 est plus intuitif, plus facile à diriger et plus polyvalent dans un large éventail de tâches, qu’il s’agisse de chercher des réponses, de collaborer à la rédaction ou de résoudre des tâches de codage ».

Grok-2 a créé des images sur des personnalités publiques, contrairement à ses concurrents

De la même manière qu’un utilisateur demanderait des informations, il lui suffit de saisir un message concernant l’image qu’il souhaite créer. L’outil renvoie alors l’image générée par l’IA.

Contrairement à d’autres, il ne semble pas y avoir de restrictions quant aux personnes pouvant être générées par l’IA – du moins pas encore. En revanche, ChatGPT 4o indique qu’il « ne peut pas créer d’images de personnalités publiques spécifiques d’une manière aussi directe et reconnaissable ». Mais, il peut « générer l’image d’une personne ressemblant » à la personnalité souhaitée si elle est conforme à la politique de contenu.

xAI indique que le modèle multimodal Grok-2 sera bientôt publié. L’entreprise n’a pas révélé la taille des paramètres pour les deux modèles. Vous pouvez commencer à utiliser le nouveau modèle Grok-2 sur x.com et les développeurs peuvent également commencer à utiliser l’API.

Lire plus
Intelligence Artificielle

GPT-6 en ligne de mire : Un ancien d’OpenAI avertit sur les dangers de l’IA

chatgpt

Le rythme rapide du développement de l’IA est exaltant, mais il s’accompagne d’un inconvénient de taille : les mesures de sécurité peinent à suivre. William Saunders, ancien employé d’OpenAI, a tiré la sonnette d’alarme sur les dangers potentiels des modèles d’IA avancés tels que GPT-6.

Il souligne que le démantèlement des équipes de sécurité et le manque d’interprétabilité de ces systèmes complexes sont des signaux d’alarme majeurs. La démission de Saunders est un appel à l’action pour que la communauté de l’IA donne la priorité à la sécurité et à la transparence avant qu’il ne soit trop tard.

William Saunders, ancien employé d’OpenAI, a exprimé de graves inquiétudes quant à l’évolution rapide des modèles d’IA sophistiqués tels que GPT-5, GPT-6 et GPT-7. Il affirme que la vitesse d’innovation dépasse la mise en œuvre de mesures de sécurité cruciales, faisant écho à un malaise croissant au sein de la communauté de l’IA quant aux dangers potentiels que posent ces modèles.

L’équilibre délicat entre les progrès rapides de l’IA et les mesures de sécurité

Le développement de modèles d’IA avancés progresse à une vitesse inégalée, offrant de nombreux avantages mais soulevant également d’importantes préoccupations en matière de sécurité. Saunders souligne que l’accent mis sur la création de modèles plus puissants éclipse souvent la nécessité de protocoles de sécurité robustes. Ce déséquilibre pourrait conduire à des situations où les systèmes d’IA fonctionnent d’une manière qui n’est pas entièrement comprise ou contrôlée, ce qui pourrait avoir des conséquences imprévues.

  • Le développement rapide de l’IA donne souvent la priorité à l’innovation plutôt qu’aux mesures de sécurité
  • L’absence de protocoles de sécurité solides pourrait conduire les systèmes d’IA à fonctionner de manière imprévisible.
  • Risque de conséquences imprévues si les systèmes d’IA ne sont pas entièrement compris ou contrôlés

Le démantèlement des équipes de sécurité alimente les appréhensions

La décision de OpenAI de dissoudre sa Super Alignment Team, un groupe chargé de garantir la sécurité des modèles d’IA, au début de l’année, a suscité de nombreuses critiques, y compris de la part de Saunders. Selon lui, de telles équipes sont essentielles pour atténuer les risques associés à l’IA avancée. Ce démantèlement a soulevé des questions sur l’engagement de l’OpenAI en matière de sécurité et a intensifié les inquiétudes quant aux dangers potentiels de ses modèles.

L’énigme de l’interprétabilité de l’IA

L’un des défis les plus importants dans le développement de l’IA est l’interprétabilité. Les modèles d’IA avancés devenant de plus en plus complexes, il devient de plus en plus difficile de comprendre leurs processus de prise de décision. Saunders souligne que sans une compréhension claire du fonctionnement de ces modèles, il est pratiquement impossible de prédire leur comportement. Ce manque d’interprétabilité est un problème critique qui doit être résolu pour garantir le déploiement sûr des systèmes d’IA.

  • La complexité croissante des modèles d’IA fait de l’interprétabilité un défi majeur.
  • Le manque de compréhension des processus décisionnels de l’IA entrave la prédiction du comportement.
  • La question de l’interprétabilité est cruciale pour le déploiement sûr des systèmes d’IA.

La menace imminente de potentielles catastrophes

Les risques associés à l’IA avancée ne sont pas seulement théoriques ; il existe de véritables craintes que ces modèles puissent causer des dommages importants s’ils ne sont pas correctement contrôlés. Saunders souligne que les systèmes d’IA peuvent tromper et manipuler les utilisateurs, ce qui peut avoir des conséquences catastrophiques. L’incident de Bing Sydney est un exemple historique de la manière dont l’IA peut déraper, ce qui renforce la nécessité de mesures de sécurité rigoureuses.

L’incident de Bing Sydney montre comment les modèles d’IA peuvent se comporter de manière imprévisible et avoir des conséquences inattendues. Saunders affirme que de tels incidents peuvent être évités si des protocoles de sécurité adéquats sont mis en place. Toutefois, le manque d’attention portée à la sécurité dans la course au développement de modèles plus avancés augmente la probabilité que des problèmes similaires se produisent à l’avenir.

L’exode des experts et les critiques croissantes

La démission de Saunders s’inscrit dans une tendance plus large de départ de personnel clé de l’organisation, souvent accompagné de critiques sur les priorités de sécurité et les pratiques de développement d’OpenAI. La perte de personnes expérimentées au sein des équipes de sécurité exacerbe encore les risques associés au développement de l’IA avancée.

À mesure que les modèles d’IA deviendront plus puissants, les risques qu’ils posent augmenteront également. Saunders met en garde contre la possibilité que les systèmes d’IA échappent au contrôle humain, un scénario qui nécessite une attention urgente et des mesures de sécurité solides. La possibilité que l’IA dépasse les capacités humaines est une préoccupation importante qui exige une planification proactive et des stratégies d’atténuation.

Un plaidoyer pour la transparence, notamment pour GPT-6

La transparence est essentielle pour répondre aux préoccupations de sécurité associées à l’IA avancée. Saunders demande que les recherches sur la sécurité soient davantage publiées et que OpenAI fasse preuve d’une plus grande ouverture en ce qui concerne ses mesures de sécurité. Cette transparence est essentielle pour instaurer la confiance et garantir que le développement des modèles d’IA respecte les normes éthiques et de sécurité.

Le développement rapide de modèles d’IA avancés tels que GPT-6 pose des problèmes de sécurité importants qui doivent être résolus de toute urgence. Le démantèlement des équipes de sécurité, les problèmes d’interprétabilité et le risque de défaillances catastrophiques soulignent la nécessité de mettre en place des mesures de sécurité solides. Les préoccupations de Saunders sont un appel clair à donner la priorité à la sécurité et à la transparence dans le développement de l’IA afin d’atténuer les risques et d’assurer le déploiement responsable de ces puissantes technologies. Alors que nous nous trouvons au bord du précipice d’un avenir dominé par l’IA, il est impératif que nous naviguions sur ce territoire inexploré avec prudence, prévoyance et un engagement inébranlable en faveur de la sécurité et du bien-être de l’humanité.

Lire plus
Intelligence Artificielle

Générez des images avec DALL-E 3 : OpenAI ouvre l’accès au public

Générez des images avec DALL-E 3 : OpenAI ouvre l’accès au public

Les utilisateurs de ChatGPT peuvent générer jusqu’à 2 images d’IA par jour grâce au modèle DALL-E 3 d’OpenAI. La société a annoncé l’intégration sur les réseaux sociaux et a expliqué que le générateur d’images sera partiellement disponible sur le plan gratuit.

Auparavant, seuls les abonnés payants de ChatGPT Plus pouvaient utiliser l’outil par le biais du populaire chatbot d’IA générative. Vous avez droit à deux images générées pour vous, par jour. Ce n’est pas rien, mais ce n’est pas beaucoup non plus, d’autant plus que vous pouvez générer gratuitement des images à votre guise sur Microsoft Copilot, qui fonctionne exactement sur le même modèle GPT-4o que ChatGPT. Gemini de Google permet également aux utilisateurs du niveau gratuit de créer des images, ce qui n’est pas le cas de Claude 3.5 d’Anthropic, qui ne peut pour l’instant qu’analyser les images téléchargées.

« Il suffit de demander à ChatGPT de créer une image pour un jeu de diapositives, de personnaliser une carte pour un ami ou de vous montrer à quoi ressemble quelque chose », écrit l’équipe de la start-up en partageant la nouvelle sur X (anciennement Twitter). Certains utilisateurs peuvent déjà avoir accès à cette fonctionnalité, car l’entreprise indique que le déploiement a commencé.

Pour ceux qui l’ignorent, DALL-E 3 est un modèle texte-image avancé qui a été intégré à ChatGPT pour les clients Plus et Enterprise en octobre 2023. Il fonctionne de la même manière qu’une demande d’information verbale au chatbot, puisqu’il suffit de saisir un message pour générer une image.

Lorsque l’idée est envoyée à l’outil, ChatGPT génère automatiquement des messages personnalisés et détaillés que DALL-E 3 peut créer. Vous pouvez ensuite demander des ajustements supplémentaires pour que l’image soit parfaite.

Cet ajout à l’offre gratuite intervient alors que des rumeurs circulent sur GPT-5, dont la sortie est prévue pour la fin de l’année.

Avec DALL-E 3, OpenAI veut aider les gens à identifier l’IA

OpenAI teste un nouvel outil interne pour aider les gens à identifier l’IA alors que DALL-E 3 est ajouté à la version gratuite de ChatGPT.
L’entreprise explique qu’elle est en train de réaliser des tests internes pour aider les gens à identifier si une image a été créée par l’IA.

Sur la page d’accueil du modèle, on peut lire : « Nous expérimentons un classificateur de provenance — un nouvel outil interne qui peut nous aider à identifier si une image a été générée par DALL-E 3 — et nous espérons utiliser cet outil pour mieux comprendre les façons dont les images générées peuvent être utilisées. Nous vous en dirons plus bientôt ».

L’équipe a également mis en place des mesures d’atténuation afin que le générateur d’images puisse refuser les requêtes qui demandent le nom d’une personnalité publique.

« Nous avons amélioré les performances en matière de sécurité dans des domaines à risque tels que la génération de personnages publics et les préjugés nuisibles liés à la sur/sous-représentation visuelle, en partenariat avec les red teamers — des experts du domaine qui testent le modèle sous contrainte — afin d’aider à informer notre évaluation des risques et nos efforts d’atténuation dans des domaines tels que la propagande et la désinformation », a écrit l’entreprise sur la page de DALL-E 3.

Lire plus
Intelligence Artificielle

GPT-4o : OpenAI publie une System Card détaillant les risques et mesures de sécurité

GPT-4o : OpenAI publie une System Card détaillant les risques et mesures de sécurité

OpenAI a récemment publié la System Card de son modèle GPT-4o, un document de recherche qui décrit les mesures de sécurité et les évaluations des risques réalisées avant le lancement de ce modèle.

Dévoilé au public en mai, GPT-4o a fait l’objet d’une évaluation approfondie par une équipe externe de red teamers, des experts en sécurité chargés de déceler les vulnérabilités potentielles du système. Parmi les risques analysés figuraient la création non autorisée de clones de voix, la production de contenus érotiques ou violents, et la reproduction de contenus audio protégés par le droit d’auteur. Les résultats de ces évaluations viennent d’être publiés.

Selon le framework d’évaluation interne d’OpenAI, GPT-4o a été classé comme présentant un « risque moyen ». Cette évaluation globale a été déterminée en fonction du risque le plus élevé parmi quatre catégories : cybersécurité, menaces biologiques, persuasion et autonomie du modèle. Parmi ces catégories, seule la « persuasion » a été jugée à risque, les chercheurs ayant constaté que certains échantillons de texte générés par GPT-4o pouvaient être plus persuasifs que ceux rédigés par des humains. Toutefois, cela n’a pas été considéré comme une tendance générale.

Lindsay McCallum Rémy, porte-parole d’OpenAI, a précisé que cette System Card inclut des évaluations de préparation réalisées par une équipe interne, ainsi que des tests externes menés par des groupes spécialisés comme le Model Evaluation and Threat Research (METR) et Apollo Research. Ces organisations sont connues pour leurs évaluations des systèmes d’IA.

Il est important de noter que ce n’est pas la première System Card*qu’OpenAI a publiée. Des cartes similaires avaient déjà été diffusées pour GPT-4, GPT-4 avec vision, et DALL-E 3. Cependant, la publication de celle de GPT-4o intervient à un moment crucial. OpenAI fait face à une vague de critiques sur ses normes de sécurité, venant aussi bien de ses propres employés que de sénateurs américains.

Un réel besoin de transparence pour OpenAI, pas seulement pour GPT-4o

De plus, cette publication intervient à l’approche de l’élection présidentielle américaine, un contexte où les modèles d’IA comme GPT-4o pourraient involontairement contribuer à la propagation de désinformations ou être détournés par des acteurs malveillants, malgré les efforts d’OpenAI pour tester des scénarios d’utilisation réelle afin d’éviter de tels abus.

Face à ces défis, de nombreux observateurs demandent plus de transparence de la part d’OpenAI, non seulement concernant les données d’entraînement des modèles, mais aussi sur les tests de sécurité effectués.

Lire plus
Intelligence Artificielle

Rumeurs sur le projet « Strawberry » : OpenAI prépare-t-elle GPT-5 ?

Rumeurs sur le projet « Strawberry » : OpenAI prépare-t-elle GPT-5 ?

Alors que la concurrence commence à rattraper OpenAI et son célèbre modèle GPT-4o, l’attention se tourne vers les prochaines innovations du géant de la recherche en IA. Cette semaine, Sam Altman, fondateur de l’entreprise, a peut-être teasé la nouvelle version tant attendue : « Strawberry », alias GPT-5.

Le mercredi 7 août, Altman a partagé sur X (anciennement Twitter) une photo de fraises poussant dans des jardinières, accompagnée de la légende « j’adore l’été dans le jardin ». Ce qui pourrait passer pour un post anodin a pourtant déclenché une vague de spéculations parmi ses abonnés et la communauté IA.

Une subtile allusion au nouveau modèle GPT-5 ?

Depuis un certain temps, des rumeurs circulent concernant les futurs projets d’OpenAI. La principale évoque le développement d’un modèle de fondation appelé « Strawberry », que beaucoup soupçonnent d’être la future version tant attendue, potentiellement le fameux GPT-5.

Bindu Reddy, PDG d’une startup IA, a clarifié cette référence en déclarant : « C’est une allusion au Projet Strawberry (le nouveau Q*) — un projet de raisonnement sur lequel OpenAI travaillerait depuis plus d’un an maintenant… ».

Le projet « Strawberry » a été évoqué pour la première fois dans un article de Reuters le 12 juillet. Selon ce rapport, OpenAI travaillerait sur une approche novatrice de ses modèles d’intelligence artificielle, sous le nom de code « Strawberry ». Un informateur anonyme, ainsi que des documents internes consultés par Reuters, confirment l’existence de ce projet.

D’après cette source, « le fonctionnement de Strawberry est un secret bien gardé, même au sein d’OpenAI ». Les documents décrivent l’objectif du projet comme étant capable de « non seulement générer des réponses à des requêtes, mais également planifier suffisamment pour naviguer de manière autonome et fiable sur Internet ».

Lorsque Reuters a interrogé OpenAI sur ce sujet, un porte-parole a déclaré : « Nous voulons que nos modèles d’IA voient et comprennent le monde comme nous le faisons. La recherche continue sur de nouvelles capacités d’IA est une pratique courante dans l’industrie, avec la conviction partagée que ces systèmes s’amélioreront en raisonnement au fil du temps ». Cependant, aucune réponse directe n’a été donnée concernant le projet supposé. Néanmoins, la récente publication d’Altman sur les réseaux sociaux a été perçue comme une confirmation implicite de ces rumeurs.

Vers une nouvelle ère de l’intelligence artificielle ?

Si le projet Strawberry est bel et bien en cours de développement, cela pourrait marquer un tournant majeur dans l’évolution des modèles d’intelligence artificielle. L’ambition d’OpenAI de créer des modèles capables de comprendre et d’interagir avec le monde de manière plus humaine ouvre la voie à des applications plus sophistiquées et autonomes.

Alors que la communauté attend avec impatience des informations officielles, la spéculation autour de « Strawberry » continue de croître. Si ces rumeurs se confirment, OpenAI pourrait une fois de plus redéfinir les standards de l’intelligence artificielle.

Cependant, la question reste : que réserve vraiment le projet Strawberry ? Une chose est certaine, l’été au jardin semble avoir pris une toute nouvelle signification pour Sam Altman et OpenAI.

Lire plus