OpenAI a lancé un nouvel outil appelé CriticGPT, un nouveau Large Language Model (LLM) d’intelligence artificielle (IA) conçu pour aider les humains à repérer les erreurs dans le code écrit par ChatGPT.

Afin d’améliorer la précision et l’utilité de ses modèles GPT, OpenAI utilise une technique appelée Reinforcement Learning from Human Feedback (RLHF), dans laquelle les humains examinent et critiquent les résultats des modèles d’IA. CriticGPT est conçu pour aider les formateurs en IA dans le processus RLHF.

Selon OpenAI, « lorsque les personnes sont aidées par CriticGPT pour réviser le code ChatGPT, elles obtiennent de meilleurs résultats que celles qui n’ont pas d’aide dans 60 % des cas », dans une expérience qui a montré qu’un formateur d’IA humain préférait les critiques d’une équipe composée d’un humain et de CriticGPT à celles d’un humain sans l’outil d’IA dans 60 % des cas.

Le principal avantage de l’association d’un humain et d’une IA pour fournir un retour d’information dans le processus RLHF est que CriticGPT peut rédiger des critiques plus complètes et plus approfondies qu’un humain opérant seul, et que les humains peuvent intervenir lorsque le modèle signale des erreurs hallucinées, ou lorsque CriticGPT signale trop de « pinaillages » inutiles.

Comment CriticGPT a-t-il été formé ?

CriticGPT a également été formé en utilisant les méthodologies RLHF de OpenAI. Les formateurs ont pris le code écrit par ChatGPT et y ont inséré des erreurs. Ils ont ensuite rédigé un exemple de feedback qu’un modèle pourrait fournir s’il avait trouvé l’erreur insérée.

Le formateur a ensuite comparé les résultats du nouveau modèle, en examinant plusieurs critiques du segment de code modifié et en constatant que le modèle avait correctement identifié et expliqué l’erreur insérée.

Quelles sont les limites de CriticGPT ?

Jusqu’à présent, les données d’entraînement de CriticGPT se sont concentrées sur les réponses courtes écrites par ChatGPT et des recherches et développements supplémentaires seront nécessaires pour qu’il puisse traiter des résultats plus longs et plus complexes. En outre, il n’est pas exempt des redoutables hallucinations de l’IA qui affligent les LLM.

Des travaux supplémentaires seront également nécessaires avant que le modèle puisse identifier et critiquer des erreurs dispersées — il ne peut actuellement traiter que des erreurs discrètes qui apparaissent à un seul endroit.

OpenAI a l’intention d’intégrer CriticGPT dans son pipeline RLHF, puis d’étendre le travail et d’accroître son utilité.

Proton Pass : Vos pièces jointes sensibles enfin sécurisées !

TikTok lance « Footnotes » : Les notes communautaires contre la désinformation

Outil Capture d’écran sur Windows 11 : Copiez du texte sans capture, merci l’IA !

La fin des DMs ? X prépare une messagerie révolutionnaire avec XChat

Test des Huawei FreeArc : des écouteurs ouverts à prix cassé pour les sportifs

Test des Huawei FreeBuds Pro 4 : Son haute-fidélité à un prix abordable !

Test des Xiaomi OpenWear Stereo : Une alternative aux écouteurs intra-auriculaires ?

Test du Microsoft Surface Laptop 7 : Une surprenante renaissance avec le Snapdragon X Elite

Xbox : Achetez des jeux et Game Pass directement, adieu le Remote Play

Honor 400 et 400 Pro : Fiche technique complète avant le lancement

Moto Pad 60 Pro : La tablette Motorola qui va booster votre productivité

CMF Phone 2 Pro : Nothing prêt à secouer le marché des smartphones abordables

Huawei Eyewear 2 : Le style rétro rencontre l’IA, mais uniquement en Chine

Moto Book 60 : Motorola dévoile son premier ultrabook haut de gamme

OpenAI lance Codex CLI : Le futur du développement logiciel est là

Grok se souvient de vous : L’IA d’Elon Musk se dote enfin d’une mémoire !

Firebase Studio : Google dévoile l’outil IA qui va révolutionner le développement d’applications !

Créez sans coder : Le Vibe Coding pour tous avec l’IA

Qu’est-ce que le Vibe Coding et pourquoi il est risqué ?

Vibe Coding : L’IA peut-elle vraiment remplacer les développeurs ? Les dangers du « code à l’aveugle »

L’IA au secours des API : Le guide pour les utiliser facilement, même sans coder !

Débuter sur GitHub : Le guide simple pour les développeurs

Migrer de Google à Proton : e-mails, mots de passe, fichiers, le guide étape par étape

Connecter Android et Windows : toutes les solutions pour utiliser vos applis sur PC !

OpenAI lance CriticGPT : Un outil révolutionnaire pour détecter les erreurs de code

Comment CriticGPT a-t-il été formé ?

Quelles sont les limites de CriticGPT ?

Asus VivoWatch 6 : La première smartwatch à mesurer la pression artérielle et l’ECG avec les doigts

HMD Skyline et Nighthawk : Le renouveau des smartphones inspirés du design Nokia

The author Yohann Poiron

OpenAI lance CriticGPT : Un outil révolutionnaire pour détecter les erreurs de code

Comment CriticGPT a-t-il été formé ?

Quelles sont les limites de CriticGPT ?

The author Yohann Poiron

vous pourriez aussi aimer