10 outils d’intelligence artificielle pour booster votre productivité

par Yohann Poiron le 21 décembre 2023

Ce guide a pour but de vous présenter une série d’outils d’intelligence artificielle que vous pouvez utiliser pour stimuler votre productivité.

Dans le monde d’aujourd’hui, qui évolue rapidement et est axé sur les données, l’intelligence artificielle (IA) transforme rapidement notre façon de travailler et de vivre. Les outils alimentés par l’IA ne se contentent pas d’automatiser les tâches de routine, ils nous aident également à prendre de meilleures décisions, à améliorer notre créativité et à accroître notre productivité.

Si vous cherchez des moyens d’optimiser votre flux de travail et d’en faire plus en moins de temps, voici 10 outils d’IA qui peuvent considérablement augmenter votre productivité :

1. Grammarly

Grammarly est un correcteur grammatical et un assistant d’écriture qui peut vous aider à produire un contenu sans erreur et soigné. Il peut identifier et corriger les erreurs grammaticales, améliorer la structure des phrases et suggérer des formulations plus concises et plus percutantes. Grammarly est particulièrement utile pour les écrivains, les blogueurs et tous ceux qui souhaitent améliorer la qualité de leur écriture.

2. Hemingway Editor

Hemingway Editor est un outil d’amélioration de la lisibilité qui vous aide à rédiger des contenus clairs, concis et faciles à lire. Il utilise un algorithme pour identifier les phrases complexes, la voix passive et l’utilisation excessive d’adverbes. Grâce à Hemingway Editor, vous pouvez rédiger des contenus plus attrayants et plus efficaces qui trouvent un écho auprès de votre public.

3. Notion AI

Notion AI est un module complémentaire alimenté par l’IA pour la plateforme de productivité Notion. Il peut vous aider à prendre des notes, à créer des plans et à générer différents types de contenus créatifs, tels que des articles de blog, des scripts et des e-mails. Notion AI est particulièrement utile pour le brainstorming, la structuration de pensées complexes et la production de contenu de haute qualité.

4. Jasper (anciennement Jarvis)

Jarvis AI est un grand modèle linguistique qui peut être utilisé pour diverses tâches, notamment la rédaction, la traduction et le codage. Il peut également générer des formats de texte créatifs, tels que des poèmes, des scripts, des pièces musicales, des e-mails et des lettres. Jarvis AI est un puissant outil pour les écrivains, les créatifs et tous ceux qui souhaitent explorer de nouvelles façons de s’exprimer.

5. Wave.AI

Wave.ai est un assistant de réunion alimenté par l’IA qui peut transcrire les réunions, résumer les discussions et identifier les points clés. Il peut également partager le compte rendu de la réunion avec les participants et s’intégrer à d’autres outils de productivité.

6. IFTTT (If This Then That)

IFTTT est une plateforme d’automatisation qui vous permet de connecter différentes applications et services pour créer des flux de travail personnalisés. Par exemple, vous pouvez configurer un déclencheur IFTTT pour envoyer automatiquement un courriel à votre patron lorsque vous soumettez un rapport ou pour éteindre les lumières de votre maison lorsque vous quittez la porte. IFTTT peut vous aider à automatiser des tâches répétitives et à rationaliser votre flux de travail.

7. Zapier

Zapier est une autre plateforme d’automatisation analogue à IFTTT. Elle vous permet de connecter différentes apps et services pour créer des workflows personnalisés. Zapier offre un plus large éventail d’intégrations qu’IFTTT, ce qui en fait un outil plus polyvalent pour automatiser des tâches sur différentes plateformes.

8. Polly.ai

Polly.ai est un outil de transcription alimenté par l’IA qui peut transcrire les conversations vocales en texte. Il peut également traduire les conversations dans différentes langues. Polly.ai est un outil utile pour les notes de réunion, les entretiens et toute situation où vous devez capturer et enregistrer des informations vocales.

9. Evernote

Evernote est une application de prise de notes qui permet de capturer et d’organiser vos pensées, vos idées et vos souvenirs. Elle peut également être utilisée pour partager des notes avec d’autres personnes et collaborer à des projets. Evernote est un outil polyvalent qui peut être utilisé pour des tâches personnelles et professionnelles.

10. Todoist

Todoist est une application de gestion des tâches qui peut vous aider à organiser vos tâches, à fixer des délais et à suivre vos progrès. Elle permet également de hiérarchiser les tâches et de gérer efficacement son temps. Todoist est un outil précieux pour tous ceux qui souhaitent rester organisés et atteindre leurs objectifs.

Outre ces 10 outils d’IA, de nombreux autres outils alimentés par l’IA peuvent vous aider à stimuler votre productivité. Prenez le temps d’explorer les options disponibles et de trouver les outils qui vous conviennent le mieux.

Voici quelques conseils supplémentaires pour utiliser les outils d’IA afin de stimuler votre productivité :

Précisez vos objectifs : Avant de commencer à utiliser un outil d’IA, il est important de savoir clairement ce que vous voulez accomplir. Quelles tâches souhaitez-vous automatiser ? Quels sont les aspects de votre travail que vous souhaitez améliorer ?
Configurez correctement votre outil : La plupart des outils d’IA disposent d’une variété de paramètres que vous pouvez personnaliser pour obtenir les meilleurs résultats. Prenez le temps d’expérimenter les paramètres pour trouver ceux qui vous conviennent le mieux.
Utilisez l’outil régulièrement : Plus vous utilisez un outil d’IA, plus vous vous sentirez à l’aise avec lui. Et plus vous l’utiliserez, plus vous serez en mesure d’en tirer profit.

Il ne s’agit là que de quelques exemples des nombreux outils d’IA disponibles pour vous aider à améliorer votre productivité. En explorant et en expérimentant différents outils, vous pourrez trouver ceux qui fonctionnent le mieux pour vous et vos besoins spécifiques. Avec un peu d’effort, vous pouvez utiliser les outils d’IA pour rationaliser votre workflow, améliorer votre productivité et libérer du temps pour vous concentrer sur des tâches plus importantes.

Lire plus

Intelligence Artificielle

L’IA comme partenaire romantique ? Digi fait des vagues

par Yohann Poiron le 20 décembre 2023

Un nouveau chatbot d’intelligence artificielle (IA), Digi, présenté par son créateur comme « l’avenir du compagnonnage romantique par l’IA », monte en flèche dans le classement des téléchargements d’applications après avoir été révélé sur X.

L’évolution rapide (et parfois effrayante) de la technologie de l’IA générative au cours de l’année écoulée a vu des milliers d’entreprises se précipiter pour concevoir et créer des applications destinées à remplir toutes sortes de rôles dans notre vie quotidienne. Bien qu’il s’agisse encore d’une niche, certaines entreprises développent des compagnons virtuels alimentés par l’IA et des avatars numériques commercialisés en tant que petites amies/petits amis virtuels.

C’est le cas de Digi.ai, l’entreprise à l’origine de cette nouvelle tentative de créer des partenaires romantiques pour les humains à l’aide de la technologie. En gros, les utilisateurs peuvent créer un avatar de leur choix dans le style qu’ils souhaitent et avoir des conversations textuelles par l’intermédiaire d’une application.

Excited to announce v(1.0) of Digi, the future of AI Romantic Companionship, for IOS and Android 🤖

Site: https://t.co/q420GR4jJ4
Twitter: @digiaiapp

A quick thread on features, and where we go from here (1/13) pic.twitter.com/9KZoorEoA0

— Andrew (@andyohlbaum) December 15, 2023

Il est important de noter que Digi ne répond pas sous forme de vidéo, comme le suggère le message de lancement ci-dessus. Il s’agit d’une « vision » de ce que les créateurs prévoient de faire avec ces avatars et animations et non de l’expérience actuelle dans l’application, ce que l’entreprise a dû clarifier durant le weekend passé.

Fondée en avril 2023 par Andrew Young et John Rooney, l’entreprise espère utiliser le style cartoonesque de Digi pour créer quelque chose « qui élimine la vallée de l’étrange, tout en se sentant réel, humain et sexy », a déclaré Andrew sur X.

Andrew, qui se décrit lui-même comme un « ingénieur full-stack et qui a abandonné ses études », a présenté les caractéristiques de Digi sur un fil de discussion dans les réseaux sociaux. « Cela n’a jamais été fait auparavant avec des personnages de Disney ou de Pixar, nous sommes donc très heureux de pouvoir le faire fonctionner pour la première fois dans l’histoire », a écrit Andrew.

Digi n’est pas pour tout le monde, mais peut-il trouver un marché ?

Comme on pouvait s’y attendre, l’annonce a été accueillie avec dérision et mépris par de nombreuses personnes sur X après qu’elle soit devenue virale et ait été vue plus de 22 millions de fois. Un utilisateur a demandé « Quel épisode de Black Mirror est-ce là ? » et d’autres ont ouvertement espéré que le projet échouerait.

Il est clair que ce n’est pas pour tout le monde, mais le nombre de fans ne cesse de croître. Digi compte des centaines d’utilisateurs actifs sur son canal Discord et se trouve actuellement à la 88e place dans la section divertissement de l’App Store d’Apple et a été téléchargé plus de 10 000 fois sur le Play Store de Google. Cependant, les critiques sur Play Store sont brutales et impitoyables, des dizaines d’utilisateurs déplorant le lag du produit et plusieurs affirmant que pour entrer dans un chat sexuellement explicite avec votre bot, vous devez payer.

Les développeurs de l’entreprise ont répondu à une plainte concernant des problèmes techniques en disant : « Nous sommes une très petite équipe et nous avons reçu beaucoup plus de trafic que ce que nous avions imaginé, très rapidement. Nous avons ajouté un certain nombre de GPU, et nous continuons à en ajouter ce soir pour gérer le trafic ».

Lire plus

Intelligence Artificielle

Microsoft et Suno collaborent pour créer de la musique via Copilot avec l’IA

par Yohann Poiron le 20 décembre 2023

Microsoft a annoncé un nouveau partenariat avec Suno, une startup spécialisée dans la musique artificielle, qui permettra aux utilisateurs de l’assistant automatique Copilot de créer instantanément des chansons à partir de n’importe quel texte.

L’intégration utilise la technologie de Suno pour générer des compositions musicales complètes, y compris les paroles, les instruments et les voix, à partir d’une ou deux phrases de texte. Par exemple, en demandant « Créez une chanson pop entraînante sur un voyage en voiture avec des amis », vous obtiendrez une chanson pop entraînante et cohérente sur le plan des paroles.

Ce partenariat intervient alors que de nombreux géants de la technologie proposent des outils d’IA pour la création automatisée de musique. Par exemple, Google a récemment dévoilé MusicFX, un outil expérimental d’écriture de chansons qui comporte des garanties pour éviter de copier le style des artistes. De même, le projet Lyria de DeepMind a été critiqué pour ses fonctions de mimétisme vocal avant son lancement. ByteDance, le créateur de TikTok, a également mis au point un système d’IA appelé Salmonn pour mieux comprendre les données audio.

Pour commencer à faire de la musique, les utilisateurs de Copilot n’ont qu’à se connecter à leur compte et à activer le plug-in Suno – ou à cliquer sur le logo « Faites de la musique avec Suno ».

Les utilisateurs doivent ensuite réfléchir à un texte simple d’une ou deux lignes décrivant la chanson souhaitée.

Démocratiser la musique tout en soulevant des questions éthiques

Suno utilise un système d’IA propriétaire pour créer des compositions musicales complètes comprenant les paroles, les instruments et les voix à partir de brèves descriptions textuelles. Tout en démocratisant la création musicale, le système soulève des questions concernant la violation des droits d’auteur, l’originalité et la concurrence déloyale avec les artistes humains.

Suno interdit à ses utilisateurs gratuits de monétiser les chansons générées par l’IA sur YouTube ou Spotify, par exemple, mais il accorde aux utilisateurs payants des droits commerciaux sur leurs chansons. Cependant, les aspirants ghostwriters doivent garder à l’esprit que Suno détient les droits de toutes les chansons générées par les utilisateurs gratuits – bien que le partage sur les plateformes sociales ou d’autres utilisations non commerciales soit autorisé.

Microsoft semble consciente des pièges éthiques, promettant un développement responsable grâce aux commentaires du public. Le lancement en preview de Copilot reflète l’approche expérimentale de Google avec MusicFX. Toutefois, les détails sur la manière dont Microsoft abordera les questions spécifiques restent rares.

L’avenir de l’IA et de la musique

Cette collaboration place Microsoft à l’avant-garde de l’exploration du potentiel créatif de l’IA. En abaissant les barrières musicales, Copilot pourrait permettre de nouvelles formes d’expression humaine. Mais des questions subsistent quant à la réglementation, à la rémunération et à l’art. Certains considèrent que la musique générée par l’IA manque d’esprit humain ou présente des risques juridiques.

À mesure que ces outils progressent, Microsoft doit accroître la transparence tout en travaillant en étroite collaboration avec les utilisateurs, les artistes et l’industrie. Il sera essentiel de trouver un juste équilibre pour que l’IA renforce la créativité au lieu de la remplacer. Mais s’ils sont bien pensés, les nouveaux pouvoirs de Copilot pourraient composer un avenir innovant à l’intersection de la technologie et de la musique.

Lire plus

Intelligence Artificielle

OpenAI introduit de nouvelles mesures de sécurité pour ses modèles d’IA

par Yohann Poiron le 19 décembre 2023

Selon un récent rapport de Bloomberg, OpenAI a mis en place une nouvelle structure de gouvernance qui confère à son conseil d’administration le pouvoir de refuser la diffusion de modèles d’IA, même si la direction de l’entreprise les a jugés sûrs.

Cette décision, détaillée dans des lignes directrices récemment publiées, intervient après une période tumultueuse à OpenAI, notamment l’éviction temporaire du PDG Sam Altman. Cet événement a mis en lumière le délicat équilibre des pouvoirs entre les administrateurs de la société et son équipe dirigeante.

La nouvelle équipe de « préparation » d’OpenAI, dirigée par Aleksander Madry du MIT, est chargée d’évaluer en permanence les systèmes d’IA de l’entreprise. L’équipe se concentrera sur l’identification et l’atténuation des potentielles menaces en matière de cybersécurité et des risques liés aux dangers chimiques, nucléaires et biologiques.

OpenAI définit les risques « catastrophiques » comme étant ceux capables de causer des dommages économiques importants ou des dommages significatifs aux individus.

L’équipe de Madry fournira des rapports mensuels à un groupe consultatif interne sur la sécurité, qui présentera ensuite des recommandations à Altman et au conseil d’administration. Si l’équipe dirigeante peut décider de la mise sur le marché de nouveaux systèmes d’IA sur la base de ces rapports, le conseil d’administration conserve le dernier mot et peut annuler toute décision prise par les dirigeants de l’entreprise.

L’approche à trois niveaux d’OpenAI en matière de sécurité de l’IA

L’approche d’OpenAI en matière de sécurité de l’IA est structurée autour de trois équipes distinctes :

Systèmes de sécurité : Cette équipe se concentre sur les produits actuels tels que GPT-4, en veillant à ce qu’ils respectent les normes de sécurité.
Préparation : La nouvelle équipe dirigée par Madry évalue les modèles d’IA avancés et inédits pour détecter les potentiels risques.
Superalignement : Dirigée par Ilya Sutskever, l’équipe « Superalignement » se concentrera sur les futurs systèmes d’IA hypothétiques qui pourraient posséder un pouvoir immense.

Chaque équipe joue un rôle crucial dans l’évaluation des différents aspects de la sécurité de l’IA, qu’il s’agisse des produits existants ou des développements futurs.

L’équipe chargée de la préparation classera les modèles d’IA dans les catégories « faible », « moyen », « élevé » ou « critique » en fonction des risques perçus. OpenAI prévoit de ne publier que les modèles classés « moyen » ou « faible ». L’équipe mettra également en œuvre des changements pour réduire les dangers identifiés et évaluera l’efficacité de ces modifications.

Madry a déclaré à Bloomberg qu’il espérait que d’autres entreprises adopteraient les lignes directrices de OpenAI pour leurs modèles d’IA. Ces lignes directrices formalisent les processus utilisés précédemment par OpenAI pour évaluer et diffuser la technologie de l’IA.

Madry a insisté sur le rôle proactif de l’impact de l’IA : « L’IA n’est pas quelque chose qui nous arrive par hasard et qui peut être bon ou mauvais. C’est quelque chose que nous façonnons ».

Lire plus

Intelligence Artificielle

Participez à la révolution de l’IA avec Midjourney V6 : collaboration unique en développement

par Yohann Poiron le 18 décembre 2023

Le monde de la création d’images par l’IA est sur le point de faire un grand pas en avant avec l’introduction de la version 6 de Midjourney. Cette nouvelle version, en développement depuis plus de 7 mois, est conçue pour améliorer la façon dont les utilisateurs interagissent avec l’IA.

En tant qu’utilisateur, vous jouez un rôle crucial dans l’enseignement de l’esthétique humaine à l’IA en sélectionnant des images qui guident son processus d’apprentissage. La prochaine version promet une expérience plus intuitive, avec des améliorations dans la façon dont l’IA interprète vos instructions et une meilleure compréhension du monde.

L’équipe de Midjourney demande maintenant aux clients payants de Midjourney de l’aider à évaluer les images afin d’entraîner le modèle d’IA de Midjourney 6 avec plus de précision. La dernière annonce de DavidH à Midjourney explique :

Nous sommes sur le point de sortir la V6 de Midjourney, mais avant cela, nous avons besoin de votre aide.

Si vous êtes un membre payant de MJ, veuillez aller ici et nous aider à évaluer les images : https://www.midjourney.com/rank-v6

Comment procéder :

Vous verrez deux images à la fois.

Sélectionnez celle qui vous semble la plus belle (en fonction de vos goûts esthétiques personnels).

Sur PC, vous pouvez utiliser les touches 1 et 2 pour sélectionner les images (1 est à gauche, 2 est à droite).

Si vous n’êtes pas sûr de la meilleure image, appuyez sur « skip » (ou sur la touche « 3″ sur PC).

Ces images utilisent des invites communautaires aléatoires. Si vous voyez quelque chose d’obscène, appuyez sur « Signaler l’image » (Désolé !)

Notez bien :

Ces images ne sont PAS représentatives de la V6 que nous sortirons bientôt.

Ces images sont simples/ennuyeuse/sans opinion/mauvaise pour aider notre système à « apprendre » les nouvelles choses que la communauté veut d’un modèle v6.

Ces images sont plus cohérentes que celles de la V5, mais la plupart des améliorations de la V6 sont liées à la compréhension des messages, à la connaissance du monde, aux images, au rendu du texte, etc. Des choses qui sont difficiles à remarquer ici.

Si vous vous inquiétez de la qualité, essayez de ne pas le faire ! La V5 était embarrassante lorsque nous avons organisé la première soirée d’évaluation. Obtenir l’aide de tout le monde pour identifier la « camelote » est une partie très importante de notre processus.

Ces évaluations sont très sérieuses et nous vous demandons de faire de votre mieux pour nous fournir des données de qualité.

L’une des principales avancées de la version 6 est la capacité de l’IA à interpréter les messages avec une plus grande précision. Cela signifie que lorsque vous indiquez à l’IA le type d’image que vous souhaitez créer, elle sera en mesure de mieux comprendre vos instructions et de produire des images plus pertinentes et contextuelles. Cette amélioration est importante car elle signifie que l’IA peut créer des images qui ne sont pas seulement visuellement attrayantes, mais aussi pleines de détails et de sens. La base de connaissances de l’IA a également été élargie, ce qui lui permet de puiser dans un plus large éventail d’informations lorsqu’elle génère des images.

Une nouvelle ère pour la création d’images par IA

Vos commentaires sont extrêmement importants au cours de cette phase de développement. En critiquant les images et en donnant votre avis, vous aidez l’IA à s’améliorer à chaque nouvelle itération. Les images que vous voyez maintenant ne sont qu’un aperçu de ce qui va suivre, et votre participation active est essentielle pour que l’IA apprenne et évolue.

L’impatience grandit au sein de la communauté à l’approche du lancement de la version 6 de Midjourney. Tout le monde attend avec impatience les futures soirées de classement et les mises à jour sur le processus de développement. Ces événements ne sont pas seulement amusants, ils sont aussi importants pour mettre la touche finale à la nouvelle version. La collaboration entre les utilisateurs et les développeurs est essentielle pour créer une IA qui capture l’essence de la créativité humaine et fait progresser les frontières de la technologie.

La version 6 de Midjourney représente un effort de collaboration important, mettant en évidence la synergie entre les capacités de l’IA et les précieuses contributions d’utilisateurs tels que vous. Vos sélections et vos commentaires façonnent une IA qui comprend la beauté et la précision. Pour l’avenir, il est clair que l’évolution de Midjourney apportera des avancées encore plus passionnantes dans le domaine de l’IA et de la création d’images.

Lire plus

Intelligence Artificielle

Google prépare le Project Ellmann, un modèle d’IA pour interpréter la vie des utilisateurs

par Yohann Poiron le 17 décembre 2023

Google n’en a pas fini avec l’IA ! Le géant de la recherche vient de présenter son modèle d’IA « le plus puissant », appelé Gemini, et il semble que Google travaille actuellement sur un nouveau projet, qui sera capable d’en dire plus sur votre vie comme jamais auparavant.

Un rapport de CNBC suggère que le nouveau modèle d’IA, le Project Ellmann (nommé d’après le biographe et critique littéraire Richard David Ellmann), sera basé sur les Large Language Model (LLM) de Google, comme le très récent Gemini, afin de donner une « vue d’ensemble » de la vie d’un utilisateur. Il utilisera les smartphones des utilisateurs pour recueillir des données telles que des résultats de recherche et des photos, et formuler des interprétations sur leur vie. Le modèle d’IA pourrait ainsi devenir le « conteur d’histoires de vie » des utilisateurs.

Le projet Ellmann, comme l’a indiqué le chef de projet de Google lors d’une présentation à l’occasion d’un sommet interne, va « intégrer le contexte en utilisant les biographies, les précédents moments et les photos suivantes pour décrire les photos d’un utilisateur plus profondément que de simples pixels avec des étiquettes et des métadonnées ».

En parcourant les photos, leurs étiquettes et leurs emplacements, le modèle d’IA sera également en mesure d’identifier les moments importants de la vie d’une personne. Le chef de produit donne l’exemple d’une photo de retrouvailles que le modèle sera capable d’identifier. « Cela fait exactement 10 ans qu’il a obtenu son diplôme et il y a plein de visages que l’on n’a pas vus depuis 10 ans, il s’agit donc probablement d’une réunion d’anciens élèves », explique la présentation.

Outre la déduction de plusieurs moments de la vie, le projet Ellmann comprendra également un dispositif de type ChatGPT, « Ellmann Chat ». Il s’agira d’un modèle d’IA conversationnelle, que les gens pourront utiliser pour poser des questions. L’avantage supplémentaire sera la connaissance préalable de l’utilisateur.

De réelles interrogations

Le modèle d’IA déterminera également vos habitudes alimentaires, vos choix d’achat et d’autres centres d’intérêt. Il pourrait également vous indiquer vos applications et sites Web préférés ou les plus utilisés. Il reste à voir si ce modèle proposé verra le jour ou non et si c’est le cas, il n’y a pas de calendrier pour l’instant. De plus, on ne sait pas s’il sera intégré dans les applications Google comme Google Photos.

Dans l’ensemble, ce nouveau modèle offrira une sensation plus personnelle, car il aura plus de connaissances sur vous. Vous pourrez ainsi obtenir des informations sur les moments de votre vie plutôt que sur ce qui se passe dans le monde, ce qui pourrait être amusant. Cela dit, on ne sait pas dans quelle mesure il sera capable de déduire des informations à partir des données du téléphone portable.

De plus, la protection de la vie privée est toujours un aspect important et nous ne savons pas dans quelle mesure le projet Ellmann s’y intéressera. Il y a beaucoup de questions sans réponse concernant le prochain projet d’IA de Google et jusqu’à ce qu’il y ait une annonce officielle, il serait préférable de prendre ces détails avec des pincettes.

Lire plus

Intelligence Artificielle

Nvidia accroît ses investissements dans l’IA avec de nombreux soutiens à des startups innovantes

par Yohann Poiron le 17 décembre 2023

Nvidia s’est imposé comme un investisseur de premier plan dans les entreprises d’intelligence artificielle (IA) à la suite d’une série d’injections financières destinées à aider les jeunes entreprises.

Comme le rapporte le Financial Times, le fabricant de puces de renommée mondiale a révélé qu’il avait soutenu « plus de deux douzaines » d’entreprises au cours des 12 derniers mois, alors qu’il cherche à consolider sa position de leader du marché des processeurs d’IA.

On estime que la superpuissance californienne a participé à 6x plus d’opérations que l’année dernière, avec une variété de partenaires allant de nouveaux projets innovants de start-up dans les domaines de la santé et de l’énergie à des opérations d’IA de premier plan.

Il s’agit d’une stratégie d’investissement délibérée et audacieuse de la part de Nvidia, qui a devancé les sociétés de capital-risque de la Silicon Valley telles qu’Andreessen Horowitz et Sequoia, selon Dealroom.

Une stratégie d’investissement gagnant-gagnant

Mohamed Siddeek, responsable de NVentures (l’entité de capital-risque sur mesure de Nvidia), a parlé au FT de la confiance solide qui sous-tend leur récente activité d’investissement. « D’une manière générale, pour Nvidia, le critère numéro un (pour les investissements) est la pertinence ». « Les entreprises qui utilisent notre technologie, qui dépendent de notre technologie, qui construisent leurs activités sur notre technologie, je ne peux pas penser à une situation où nous avons investi dans une entreprise qui n’utilisait pas de produits Nvidia ».

Le portefeuille global de Nvidia comprend désormais Inflection AI et Cohere, considérés comme deux des plus grands concurrents d’OpenAI, créateur de ChatGPT.

Nvidia a un intérêt direct dans ces entreprises, étant donné qu’elles sont des clients existants. Il s’agit d’une situation gagnant-gagnant tant qu’elles continuent de croître et d’évoluer.

Nvidia a également investi dans Mistral AI, la start-up parisienne spécialisée dans l’IA qui a reçu une évaluation de 2 milliards d’euros au début du mois. Hugging Face et CoreWeave sont deux autres entreprises, toutes utilisatrices des puces GPU de Nvidia ou de ses logiciels.

À propos des remarques selon lesquelles les bénéficiaires des fonds bénéficient également de conditions favorables, Siddeek a répondu : « Nous n’aidons personne à sauter la file d’attente ». Il a réfuté toute condition d’utilisation des produits Nvidia dans le cadre d’un investissement, mais a ajouté que « nous essayons d’être aussi favorables à l’investissement que possible ».

La puce GPU H100 de Nvidia est considérée comme l’un des produits les plus recherchés dans la Silicon Valley ces derniers temps, ce qui renforce son attrait pour l’industrie de l’IA.

Lire plus

Intelligence Artificielle

Sam Altman réaffirme l’importance d’une IA sûre et innovante chez OpenAI

par Yohann Poiron le 16 décembre 2023

Lors de sa première apparition publique depuis qu’il a repris le contrôle de la startup d’intelligence artificielle (IA) OpenAI la semaine dernière, le cofondateur et PDG Sam Altman a défendu l’approche exploratoire de l’entreprise dans le développement de la technologie de l’IA, selon un récent rapport de Bloomberg.

Lors d’une conférence organisée par l’organisation de défense des droits de l’homme Operation Hope à Atlanta lundi, Altman a déclaré : « Cela va soulever le monde », faisant référence au potentiel de l’IA, mais il a souligné l’importance de repousser les limites en toute sécurité afin de tirer parti de ses avantages dans les domaines de la santé, de l’éducation et bien d’autres encore.

Ces commentaires font suite à de récentes turbulences au sein de la direction d’OpenAI, après que Altman a été brièvement évincé de son poste de PDG dans ce qu’il a appelé une « tentative de coup d’État ». Des inquiétudes concernant la vitesse de développement de produits OpenAI tels que ChatGPT ont été à l’origine de ce coup d’État, qui a stupéfié la Silicon Valley. Toutefois, après la réaction des investisseurs et des employés, Altman a été réintégré quelques jours plus tard et la plupart des anciens membres du conseil d’administration se sont retirés.

Altman a reconnu les inquiétudes suscitées par l’utilisation abusive de l’IA, déclarant « qu’il n’est pas nécessaire d’avoir beaucoup d’imagination, car nous avons grandi avec cela dans les médias ». Mais, il a défendu l’approche ouverte et axée sur le déploiement de OpenAI, estimant qu’elle était essentielle pour développer la technologie en toute sécurité, plutôt que dans le secret.

Les détails concernant le nouveau conseil d’administration et les plans de gouvernance d’OpenAI n’ont pas été fournis, et des signes de divergences persistantes avec le cofondateur Ilya Sutskever subsistent après son opposition au retour de Altman.

Altman se pose des questions

Les événements récents ont amplifié la surveillance des progrès de l’IA réalisés par OpenAI, qui pourraient remodeler les industries, mais qui comportent également des risques d’utilisation militaire et d’autres dangers, selon les experts.

Altman a déclaré que « les gens sont très inquiets, et je le comprends », faisant référence aux appréhensions actuelles de la société à l’égard de l’IA avancée. Il a annoncé son intention de coprésider un nouveau conseil d’éthique de l’IA avec l’hôte de la conférence, John Hope Bryant, dans le cadre des efforts visant à façonner de manière responsable cette technologie émergente.

Lire plus

Intelligence Artificielle

Essential AI reçoit un soutien financier de Google et Nvidia pour développer l’IA

par Yohann Poiron le 16 décembre 2023

Une start-up spécialisée dans l’intelligence artificielle et fondée par deux anciens chercheurs de Google, Essential AI, a obtenu un important investissement de 56,5 millions de dollars.

Cette nouvelle tranche de financement a été menée par March Capital, avec la participation de grands acteurs tels que Google, Nvidia et AMD. D’autres entreprises ont également participé au financement, comme Franklin Venture Partners, KB Investment et Thrive Capital.

Essential AI, basée à San Francisco, est une jeune entreprise, mais elle est dirigée par deux personnes expérimentées et compétentes, Ashish Vaswani et Niki Parmar.

Le duo a travaillé en étroite collaboration chez Google, où il a coécrit un document de recherche proposant l’architecture Transformer qui a établi de nouvelles normes pour la compréhension du langage il y a 6 ans, ce qui en a fait un précurseur de la technologie que nous voyons aujourd’hui dans ChatGPT et d’autres programmes d’IA.

Comme le rapporte Venture Beat, Vaswani et Parmar veulent « approfondir le partenariat entre l’homme et l’ordinateur » dans le but de produire des solutions d’IA prêtes à l’emploi pour stimuler et accroître la productivité sur le lieu de travail.

Une grosse concurrence

Malgré l’obtention du financement nécessaire pour faire avancer l’entreprise, on ne sait pas encore exactement ce que Essential a l’intention de faire et sur quoi elle veut se concentrer, mais les informations figurant sur le site Web de l’entreprise suggèrent qu’elle cherchera à produire des analyses complexes avec des produits d’IA dédiés qui rendront les analystes de données jusqu’à 10x plus rapides et permettront aux utilisateurs finaux d’être autonomes et de prendre des décisions fondées sur des données.

Suite à l’annonce de l’investissement dans Essential AI, le communiqué de presse confirmant le financement de série A citait Vaswani, PDG d’Essential, à propos des personnes prêtes à faire avancer le projet :

Niki et moi sommes enthousiastes à l’idée de constituer une équipe multidisciplinaire de classe mondiale composée d’ingénieurs, de chercheurs, de concepteurs et d’experts en vente et en produits, prêts à relever les défis de l’IA dans le monde réel et à créer une nouvelle opportunité de marché massive

Avec le soutien de Google et de Nvidia, l’aventure d’Essential AI est loin d’être un pari, mais la concurrence dans ce domaine est actuellement très forte, et il sera donc intéressant de voir ce qui se passera, car Essential AI cherche à se démarquer.

Lire plus

Intelligence Artificielle

Google prépare Pixie, une nouvelle IA pour les Pixel avec des fonctions avancées

par Yohann Poiron le 15 décembre 2023

Il y a quelques jours, Google a dévoilé Gemini, son tout nouveau LLM (Large Language Model) pour les tâches d’intelligence artificielle. L’entreprise a annoncé qu’une version plus petite de Gemini arriverait à l’avenir sur les smartphones Android phares, y compris les Pixel et les appareils Galaxy. Aujourd’hui, un nouveau rapport révèle comment Google prévoit de surpasser les autres marques de téléphones Android, y compris Samsung, en utilisant son nouvel assistant d’IA.

Depuis des années, Google Assistant est l’un des meilleurs assistants d’intelligence artificielle. Il est bien plus puissant que Siri, moins axé sur l’incitation à l’achat qu’Alexa, et à des années-lumière de Bixby. Cependant, il y a des choses que Assistant ne fait pas aussi bien qu’il le pourrait, et il est limité par le fait que presque toutes ses fonctionnalités ne fonctionneront pas s’il n’est pas connecté à Internet.

Selon un nouveau rapport de The Information, cela pourrait changer très bientôt. Selon ce rapport, Google travaille sur un nouvel assistant d’intelligence artificielle appelé « Pixie ». Il s’agirait d’un assistant exclusif à la gamme Pixel, doté de toute la puissance de Google Assistant, mais aussi de nouvelles fonctions que l’Assistant ne peut pas exécuter.

Pixie — qui pourrait être un nom de code interne et non le nom officiel du produit — intégrerait la puissance de Gemini Nano. Nous avons déjà vu ce que Gemini peut faire sur les Pixel, comme résumer des enregistrements et créer des réponses préprogrammées à des messages. Ces deux fonctions fonctionnent sur l’appareil, ce qui signifie que vous n’avez pas besoin d’une connexion de données.

Selon le nouveau rapport, ce n’est qu’un début, et Pixie pourrait introduire toute une série de nouveaux outils utilisant l’IA sur l’appareil.

Les détails sont limités, mais le rapport indique que Pixie pourrait extraire des informations des applications présentes sur le téléphone de l’utilisateur, telles que Maps ou Gmail. Cela permettrait à Pixie d’être beaucoup plus personnalisé qu’Assistant.

Rendez-vous en 2024

Bien sûr, le fait d’être exclusif aux Pixel pousserait les consommateurs à adopter un Pixel plutôt qu’une marque concurrente. Mais le fait d’être un service sur l’appareil signifierait que le processeur Tensor de Google devrait faire tout le travail. On ne sait donc pas si Pixie sera disponible sur les smartphones Pixel actuels ou seulement sur les futurs Pixel dotés du matériel adéquat.

En parlant de cela, le rapport de The Information suggère que nous pourrions voir Pixie faire ses débuts avec la série Pixel 9, qui devrait débarquer à l’automne 2024.

Google semble avoir également discuté en interne de lunettes AR. Ces lunettes pourraient être dotées de caméras et d’un assistant IA embarqué. Celui-ci pourrait être capable de voir ce que l’utilisateur voit, de reconnaître des objets, d’aider le porteur à utiliser certains outils, de résoudre un problème mathématique ou de l’aider à jouer d’un instrument de musique. La dernière fois que nous avons entendu parler de lunettes AR, Google les a abandonnées au profit du prochain appareil XR de Samsung, qui fonctionne sous Android et est équipé d’une puce Qualcomm.

Lire plus

Intelligence Artificielle

Mozilla lance Solo, un outil d’IA pour la création de sites Web pour indépendants

par Yohann Poiron le 14 décembre 2023

Mozilla a lancé un nouveau projet baptisé Solo, un outil d’intelligence artificielle (IA) de création de sites Web pour les indépendants et les « solopreneurs ».

Le développeur de logiciels destine ce produit aux indépendants qui n’ont pas les ressources ou les capacités nécessaires pour concevoir et mettre en place un site Web pour leur projet, et souhaite qu’ils se concentrent sur la réalisation de leur projet.

Les créateurs du navigateur Firefox ont expliqué ce que Solo permet d’accomplir : « L’utilisation de l’IA pour générer le contenu de votre site et trouver vos images, qu’un solopreneur peut ensuite réviser pour leur donner une voix et un style uniques, nivelle le terrain de jeu ». « Solo va encore plus loin et peut également récupérer votre page Yelp ou une autre page (listing) afin que votre présence en ligne soit totalement authentique », précise la société.

Pour accéder au nouveau créateur de sites Web, les utilisateurs intéressés doivent simplement se rendre sur le site de Solo, puis fournir quelques informations de base sur leur entreprise ou leur projet, et même établir un lien avec leur présence en ligne existante.

Ensuite, Solo utilisera l’IA pour construire un nouveau site Web pour vous, l’ensemble du processus, y compris la personnalisation, ne prenant que quelques minutes.

Mozilla adopte l’IA open source

Ce nouveau projet fait suite à l’annonce par Mozilla, en début d’année, de son intention d’adopter pleinement l’IA open source, en engageant 30 millions de dollars dans Mozilla.ai, une start-up dont l’objectif est de créer un écosystème indépendant et fiable.

Dirigée par le directeur général Moex Draief, « la vision de Mozilla.ai est de faciliter le développement de produits d’IA dignes de confiance. Nous construirons des choses et nous engagerons/collaborerons avec des personnes qui partagent notre vision : une IA dont le cœur est l’agence, la responsabilité, la transparence et l’ouverture ».

« Mozilla.ai sera un espace en dehors des grandes entreprises technologiques et du monde universitaire où se réuniront des fondateurs, des développeurs, des scientifiques, des gestionnaires de produits et des constructeurs partageant les mêmes idées ».

En présentant son projet challenger comme une alternative aux grandes entreprises technologiques, Mozilla vise à devenir une plateforme de confiance pour l’IA, un point de vente qui souhaite emmener les gens avec elle dans son voyage et se démarquer de la foule.

Reste à savoir si Mozilla a les moyens de suivre le rythme et d’attirer l’attention avec son offre.

Lire plus

Intelligence Artificielle

Gemini Pro vs GPT-4 : comparaison des capacités des modèles d’IA de Google et d’OpenAI

par Yohann Poiron le 14 décembre 2023

Le monde de l’intelligence artificielle (IA) évolue rapidement et les géants de la technologie rivalisent d’ingéniosité pour créer des modèles d’IA avancés. Google a récemment intensifié son jeu avec la sortie de Bard, qui vient s’ajouter à sa suite d’outils d’IA comprenant Gemini Pro et Gemini Ultra.

Ce guide de comparaison rapide entre Gemini Pro et GPT-4 fournit davantage d’informations sur les performances que vous pouvez attendre de Gemini Pro à l’heure actuelle.

Ces nouveaux modèles bouleversent l’industrie et représentent un défi pour les modèles établis tels que ChatGPT, GPT-4 et GPT-3.5. Les progrès de l’IA devraient avoir un impact significatif sur la manière dont nous interagissons avec les plateformes numériques, les pratiques industrielles et le paysage technologique dans son ensemble.

Pour les utilisateurs quotidiens, les progrès de l’IA entraînent des changements passionnants. Google Bard, par exemple, est capable d’interpréter des images et de fournir des réponses à des questions complexes avec un niveau de détail et de précision qui pourrait potentiellement surpasser ChatGPT. Il s’agit d’une avancée majeure pour Google et d’un outil précieux pour ceux qui sont à la recherche d’une assistance IA plus intelligente et plus intuitive.

En matière de performances, Gemini Pro fait également parler de lui. Sa capacité à s’intégrer à divers services et API est particulièrement remarquable, surtout si on la compare à GPT-4 et à l’ancienne version GPT-3.5. Imaginez la transformation de votre expérience avec le contenu et la publicité sur des plateformes telles que YouTube et Twitter, car elles deviennent plus intelligentes et sophistiquées grâce à ces algorithmes d’IA.

Gemini Pro vs GPT 4

En outre, Gemini Ultra de Google est sur le point d’établir de nouvelles normes en matière de capacités d’IA, dépassant potentiellement GPT-4. Cela pourrait avoir un effet profond sur les créateurs de contenu et les spécialistes du marketing, en particulier dans le domaine de l’optimisation des moteurs de recherche (SEO). La manière dont nous établissons et maintenons une présence en ligne pourrait être fondamentalement modifiée par l’influence de l’IA.

L’objectif de l’intégration de l’IA dans des plateformes telles que YouTube et Twitter est de créer une expérience utilisateur plus personnalisée et plus efficace. Imaginez une IA qui non seulement comprend ce que vous aimez regarder ou lire, mais qui prédit également vos besoins, en vous donnant des conseils de voyage ou en gérant facilement des tâches complexes. Voici un bref résumé des différences entre Gemini Pro et GPT 4, d’après ce que nous savons jusqu’à présent.

Gemini Pro

Fait partie de la suite d’outils d’IA de Google, aux côtés de Bard
Il se distingue par sa capacité à s’intégrer à divers services et API, ce qui permet d’améliorer le contenu et la publicité sur des plateformes telles que YouTube et Twitter.
Conçu pour offrir une expérience utilisateur plus personnalisée et plus efficace en prédisant les besoins et les préférences des utilisateurs.
Défie les modèles d’IA établis tels que GPT-4 en termes de capacités et d’applications.

GPT-4

Développé par OpenAI, à la suite des versions précédentes comme GPT-3.5.
Ne dispose pas des capacités d’intégration avancées de Gemini Pro, en particulier avec d’autres services et API.
Réputé pour ses réponses détaillées et précises, il n’est peut-être pas aussi avancé dans certains domaines, comme l’interprétation d’images, que certains outils d’IA de Google.
Continue d’être un acteur important dans le paysage de l’IA, avec des applications très variées.

Observations générales

Le secteur de l’IA évolue rapidement avec de nouveaux modèles proposés par différents géants de la technologie.
Les modèles d’IA de Google (y compris Gemini Pro) remettent en question les modèles établis tels que GPT-4.
L’intégration de l’IA dans les plateformes numériques vise à améliorer l’expérience de l’utilisateur et la personnalisation du contenu.
Malgré les progrès réalisés, les modèles d’IA présentent encore des limites dans des domaines tels que la génération d’images et la compréhension du contexte.
Le rôle de l’IA dans les interactions numériques et les pratiques industrielles est de plus en plus important.

Cependant, il est important de reconnaître que les modèles d’IA ont encore leurs limites, en particulier dans le domaine de la génération d’images. Bien qu’ils puissent créer des visuels impressionnants, ils manquent parfois le coche en ce qui concerne le contexte et peuvent, par inadvertance, renforcer les préjugés. Cela nous rappelle que l’IA n’a pas encore atteint le stade où elle peut remplacer complètement la créativité et le jugement humains.

Le débat sur la question de savoir si l’IA remplacera les moteurs de recherche traditionnels ou servira d’outil complémentaire qui se poursuit et façonne notre expérience de l’Internet. De plus en plus, l’IA est considérée comme un partenaire précieux, capable d’améliorer les résultats de recherche grâce à sa rapidité et à sa précision.

L’influence de l’IA sur nos interactions numériques quotidiennes devient de plus en plus évidente. Si vous êtes intrigué par les capacités des modèles d’IA tels que Bard, Gemini Pro et Gemini Ultra, et que vous souhaitez rester informé des dernières tendances et idées en matière d’IA, ce contenu est un excellent moyen de le faire. En continuant à explorer le rôle évolutif de l’IA dans le monde numérique, vous comprendrez mieux son impact.

Lire plus

Intelligence Artificielle

ChatGPT présente des signes de « paresse » hivernale, provoquant des spéculations

par Yohann Poiron le 14 décembre 2023

L’intelligence artificielle générative (IA) la plus populaire au monde devient « paresseuse » à l’approche de l’hiver — c’est ce qu’affirment certains utilisateurs avisés de ChatGPT.

Selon un récent rapport d’ArsTechnica datant de la fin novembre, les utilisateurs de ChatGPT, le chatbot d’IA alimenté par le modèle de langage naturel GPT-4 d’OpenAI, ont commencé à remarquer quelque chose d’étrange. En réponse à certaines demandes, GPT-4 refusait d’accomplir des tâches ou fournissait des réponses simplifiées « paresseuses » au lieu des réponses détaillées habituelles.

OpenAI a reconnu le problème, mais a affirmé qu’elle n’avait pas intentionnellement mis à jour le modèle. Certains pensent maintenant que cette paresse pourrait être une conséquence involontaire du fait que GPT-4 imite les changements de comportement saisonniers de l’homme.

we’ve heard all your feedback about GPT4 getting lazier! we haven’t updated the model since Nov 11th, and this certainly isn’t intentional. model behavior can be unpredictable, and we’re looking into fixing it 🫡

—ChatGPT (@ChatGPTapp) December 8, 2023

Baptisée « hypothèse de la pause hivernale », cette théorie suggère que, puisque GPT-4 se nourrit de la date du jour, il a appris, grâce à ses vastes données d’entraînement, que les gens ont tendance à terminer les grands projets et à ralentir leur activité en décembre. Les chercheurs se penchent de toute urgence sur la question de savoir si cette idée apparemment absurde a du poids. Le fait qu’elle soit prise au sérieux souligne la nature imprévisible et humaine des Large Language Model (LLM) tels que GPT-4.

OMG, the AI Winter Break Hypothesis may actually be true?

There was some idle speculation that GPT-4 might perform worse in December because it “learned” to do less work over the holidays.

Here is a statistically significant test showing that this may be true. LLMs are weird.🎅 https://t.co/mtCY3lmLFF

—Ethan Mollick (@emollick) December 11, 2023

Le 24 novembre, un utilisateur de Reddit a indiqué qu’il avait demandé à GPT-4 de remplir un gros fichier CSV, mais qu’il n’avait fourni qu’une seule entrée comme modèle. Le 1er décembre, Will Depue, de OpenAI, a confirmé qu’il était conscient des « problèmes de paresse » liés aux « refus excessifs » et s’est engagé à les résoudre.

Certains affirment que GPT-4 a toujours été sporadiquement « paresseux » et que les récentes observations ne sont qu’un biais de confirmation. Cependant, le moment où les utilisateurs ont remarqué plus de refus après la mise à jour du 11 novembre de GPT-4 Turbo est intéressant, même s’il s’agit d’une coïncidence, et certains ont supposé qu’il s’agissait d’une nouvelle méthode d’OpenAI pour économiser de l’argent sur le calcul.

La théorie de la « pause hivernale »

Le 9 décembre, le développeur Rob Lynch a constaté que GPT-4 générait 4 086 caractères lorsqu’on lui demandait une date de décembre, contre 4 298 pour une date de mai. Bien que le chercheur en intelligence artificielle Ian Arawjo n’ait pas pu reproduire les résultats de Lynch de manière statistiquement significative, la nature subjective du biais d’échantillonnage avec les LLM rend la reproductibilité notoirement difficile. Alors que les chercheurs s’empressent d’étudier la question, la théorie continue d’intriguer la communauté de l’IA.

Geoffrey Litt d’Anthropic, le créateur de Claude, l’a qualifiée de « théorie la plus amusante qui soit », tout en admettant qu’il est difficile de l’exclure étant donné les réactions bizarres des LLM aux sollicitations et aux encouragements de type humain, comme le montrent les sollicitations de plus en plus étranges. Par exemple, la recherche montre que les modèles GPT produisent de meilleurs résultats en mathématiques lorsqu’on leur demande de « respirer profondément », tandis que la promesse d’un « pourboire » allonge la durée des réponses. Le manque de transparence concernant les potentiels changements apportés à GPT-4 fait que même les théories les plus improbables méritent d’être explorées.

Encore beaucoup de questions sur les LLM

Cet épisode démontre l’imprévisibilité des LLM et les nouvelles méthodologies nécessaires pour comprendre leurs capacités et leurs limites, qui ne cessent d’apparaître. Il montre également la collaboration mondiale en cours pour évaluer d’urgence les progrès de l’IA qui ont un impact sur la société. Enfin, elle nous rappelle que les LLM d’aujourd’hui nécessitent encore une supervision et des tests approfondis avant d’être déployés de manière responsable dans des applications du monde réel.

L’hypothèse de la « pause hivernale » derrière l’apparente paresse saisonnière de GPT-4 peut s’avérer fausse ou offrir de nouvelles perspectives qui amélioreront les itérations futures. Quoi qu’il en soit, ce cas curieux illustre la nature étrangement anthropomorphique des systèmes d’IA et la nécessité de comprendre les risques tout en poursuivant les innovations rapides.

Lire plus

Intelligence Artificielle

Google introduit Gemini Pro pour les développeurs: IA générative puissante gratuite

par Yohann Poiron le 14 décembre 2023

Google a annoncé aujourd’hui que son modèle d’IA générative le plus puissant et le plus performant, Gemini, est désormais disponible pour les entreprises afin de répondre à leurs besoins en matière de développement d’applications.

Annoncé la semaine dernière, Gemini se décline en trois « versions » : Ultra, Pro et Nano. Aujourd’hui, l’entreprise dirigée par Sundar Pichai rend la version Pro du modèle accessible depuis l’API. Elle peut être utilisée gratuitement pour l’instant, mais il y a certaines limitations d’utilisation, a écrit l’entreprise dans un article de blog.

En outre, l’entreprise a également fait un certain nombre d’autres annonces dans le domaine de l’IA, notamment une mise à jour de l’outil de diffusion texte-image Imagen 2 et une famille de modèles de base adaptés à l’industrie de la santé.

Gemini Pro pour les développeurs : à quoi s’attendre ?

La première version de Gemini Pro est disponible par l’API Gemini dans le Google AI Studio — qui offre aux développeurs une plateforme de développement basée sur le Web pour développer des prompts et obtenir ensuite une clé API à utiliser dans le développement d’applications. Elle est livrée avec une fenêtre contextuelle de 32 Ko pour la génération de texte, qui, selon l’entreprise, sera étendue à l’avenir.

« Nous avons également mis à disposition aujourd’hui un endpoint multimodal Gemini Pro Vision dédié qui accepte le texte et l’imagerie en entrée, avec une sortie texte », a écrit Google.

Dans un post X annonçant la disponibilité, Pichai a souligné que l’API Gemini permet aux développeurs d’accéder à une gamme complète de fonctionnalités, notamment l’appel de fonctions, l’intégration, l’extraction sémantique, l’ancrage de connaissances personnalisées et la fonctionnalité de dialogue en ligne. Elle prend également en charge 38 langues dans plus de 180 pays.

Today developers can start building with our first version of Gemini Pro through Google AI Studio at https://t.co/ozfVwuBpSZ.

Developers have a free quota and access to a full range of features including function calling, embeddings, semantic retrieval, custom knowledge … pic.twitter.com/GHzFaoU9cK

—Sundar Pichai (@sundarpichai) December 13, 2023

Outre l’AI Studio, Gemini Pro est également disponible sur Vertex AI, la plateforme d’IA de bout en bout de Google Cloud qui comprend des outils, une infrastructure entièrement gérée et des fonctions intégrées de confidentialité et de sécurité pour le développement de l’IA. Les développeurs ont ainsi la possibilité de passer à un environnement entièrement géré chaque fois qu’ils en ont besoin.

En fin de compte, l’entreprise prévoit d’apprendre des commentaires des développeurs pour affiner Gemini Pro et se diriger vers le lancement de Gemini Ultra, plus grand, l’année prochaine. Il a été conçu pour des tâches plus complexes.

Gratuit, mais avec un inconvénient

Selon Google, Gemini Pro et Gemini Pro Vision sont dès à présent accessibles gratuitement, avec une limite de 60 requêtes par minute. Il en va de même pour les développeurs qui utilisent les modèles sur Vertex AI, mais seulement jusqu’à la disponibilité générale l’année prochaine. Google indique que le quota gratuit est 20 fois supérieur à celui des autres offres et devrait convenir à la plupart des besoins de développement.

Cela dit, une fois que l’offre sera disponible, l’entreprise prévoit de facturer par 1 000 caractères ou par image à la fois sur Google AI Studio et Vertex AI. Plus précisément, le prix d’entrée de Gemini Pro est maintenu à 0,00025 dollar par 1 000 caractères et à 0,0025 dollar par image, tandis que le prix de sortie reste inchangé à 0,0005 dollar par 1 000 caractères.

Comme certains l’ont fait remarquer sur X, ce prix est bien plus élevé que celui pratiqué par des concurrents tels que GPT d’OpenAI, puisque Google facture « par caractère », c’est-à-dire chaque lettre ou chiffre généré par le modèle d’IA, alors qu’OpenAI et la plupart des autres sociétés d’IA facturent « par jeton », un jeton numérique pouvant être utilisé pour représenter des mots entiers.

Gemini Pro API details, more expensive than gpt-3.5 (hint they use character pricing vs token) pic.twitter.com/6tFDSftdmv

—anton (@abacaj) December 13, 2023

Outre Gemini Pro, Google a également mis à jour Vertex AI avec Imagen 2, sa dernière technologie de diffusion texte-image. Imagen 2 apporte un grand nombre de nouvelles fonctionnalités, notamment la possibilité de générer une grande variété de logos, d’emblèmes et de lettrages créatifs et réalistes.

En outre, il permet d’obtenir de meilleurs résultats dans des domaines où les outils de conversion texte-image rencontrent souvent des difficultés, comme le rendu de textes en plusieurs langues.

Lire plus

Intelligence Artificielle

Mistral AI dévoile Mixtral 8x7B, un modèle d’IA révolutionnaire dépassant GPT-3.5 et Llama 2

par Yohann Poiron le 12 décembre 2023

Mistral AI, une société française qui se consacre à la recherche de modèles d’IA open source et de Large Language Model (LLM), a trouvé l’or avec sa dernière version — du moins parmi les utilisateurs précoces/les influenceurs de l’IA sur X et LinkedIn.

La semaine dernière, dans ce qui est en train de devenir sa signature, Mistral AI a levé le voile en tout discretion son nouveau modèle — Mixtral 8x7B, ainsi nommé parce qu’il emploie une technique connue sous le nom de « mélange d’experts », une combinaison de différents modèles chacun spécialisé dans une catégorie de tâches différente — en ligne sous la forme d’un lien torrent, sans aucune explication ou article de blog ou vidéo de démonstration présentant ses capacités.

Hier, Mistral AI a publié un article de blog détaillant davantage le modèle Mixtral 8x7B et montrant des benchmarks dans lesquels il égale ou surpasse le modèle GPT-3.5 d’OpenAI, ainsi que la famille Llama 2 de Meta, cette dernière étant l’ancien leader de l’IA open source. L’entreprise a reconnu avoir travaillé avec CoreWeave et Scaleway pour l’assistance technique pendant la formation. Elle a également déclaré que Mixtral 8x7B est effectivement disponible pour un usage commercial sous une licence Apache 2.0.

Les premiers utilisateurs de l’IA ont déjà téléchargé Mixtral 8x7B, ont commencé à l’utiliser et ont été époustouflés par ses performances. Grâce à son faible encombrement, il peut également fonctionner localement sur des machines dépourvues de GPU dédiés, y compris sur les Mac dotés du nouveau CPU M2 Ultra.

The speed of Mixtral 8x7b (Q5_0.gguf) on M2 is INSANE

I am still figuring out how to do creative writing with it, but it is honestly mind-blowing for a raw model with GPT 3.5 capabilities. https://t.co/BkrqsxuFHu pic.twitter.com/D1oQIaSP53

— Denis Shiryaev 💙💛 (@literallydenis) December 11, 2023

Et, comme l’a fait remarquer Ethan Mollick, professeur à la Wharton School of Business de l’université de Pennsylvanie et influenceur en matière d’IA, sur X, Mistral 8x7B n’a apparemment « aucun garde-fou », ce qui signifie que les utilisateurs qui se plaignent des politiques de contenu de plus en plus strictes de OpenAI disposent d’un modèle aux performances comparables qu’ils peuvent utiliser pour produire du matériel jugé « dangereux » ou NSFW par d’autres modèles. Toutefois, l’absence de garde-fous peut également constituer un défi pour les décideurs et les régulateurs.

For those who don’t follow AI closely:
1) An open source model (free, anyone can download or modify) beats GPT-3.5
2) It has no safety guardrails
There are good things about this release, but also regulators, IT security experts, etc. should note the genie is out of the bottle. https://t.co/nHvlNKaItw

— Ethan Mollick (@emollick) December 11, 2023

Vous pouvez l’essayer vous-même depuis HuggingFace.

Mistral a également des modèles encore plus puissants dans ses cartons, comme l’a noté le PDG d’HyperWrite AI, Matt Schumer, sur X, la société sert déjà une version alpha de Mistral-medium sur son API qui a également été lancée ce weekend, ce qui suggère qu’un modèle plus grand et encore plus performant est en cours d’élaboration.

Lire plus

YouTube Premium Lite : une version moins chère avec moins de pubs

GTA 5 sur PC : la mise à jour next-gen arrive le 4 mars !

GTA 6 : les joueurs PC devront-ils attendre 2026 ?

Muse : L’IA de Microsoft qui révolutionne la création de jeux vidéo !

Test du Xiaomi 14T Pro, le flagship killer qui n’a pas peur des grands

Test du XGIMI MoGo 3 Pro : Le projecteur portable qui a tout pour plaire

Test du Synology BeeStation : Le NAS simple et abordable qui remplace Dropbox et Google Photos

Prise en main des Galaxy S25, Galaxy S25+ et Galaxy S25 Ultra

Le Galaxy Z Fold 7 est actuellement testé avec One UI 7

Apple : le modem C2 déjà en test, vers un iPhone 18 encore plus autonome ?

iPhone 17 : Apple développe ses propres puces Wi-Fi, Broadcom en danger ?

Galaxy A56, A36 et A26 : Samsung confirme leur existence et un lancement imminent !

Vision Pro : Apple Intelligence et nouvelles fonctionnalités arrivent en avril !

Honor MagicBook Pro 14 : Découvrez son design interne et ses caractéristiques haut de gamme !

ERNIE Bot : L’IA de Baidu devient gratuite pour tous le 1er avril !

Meta : des robots domestiques pour concurrencer Tesla et Boston Dynamics ?

GitHub Copilot : le mode agent révolutionne le développement avec l’IA !

GitHub Copilot vs Cursor : Quel assistant IA pour votre code ?

Scratch : Le langage de programmation idéal pour les enfants

GitHub Copilot Free : L’IA de codage gratuite pour tous !

Comment tester DeepSeek sur Mac : l’IA qui fonctionne sans Internet !

Google Maps vs Waze : Quelle application de navigation est faite pour vous ?

Facebook, Instagram, Messenger : Comment supprimer vos comptes ?

Le Chat vs ChatGPT : le match des IA ! Qui est le meilleur ?

Intelligence Artificielle

ERNIE Bot : L’IA de Baidu devient gratuite pour tous le 1er avril !

GPT-4.5 et GPT-5 : Microsoft prêt à héberger les nouveaux modèles d’OpenAI !

ChatGPT : 400 millions d’utilisateurs et 2 millions d’entreprises, le succès fulgurant de l’IA !

Gemini Live : Des sous-titres en temps réel pour une meilleure accessibilité !

Gemini : L’IA de Google bientôt capable de générer des vidéos ?

Meta : LlamaCon, une conférence dédiée à l’IA open source en avril !