Twitter a tenu l’une des nombreuses promesses de son PDG Elon Musk, en publiant vendredi après-midi sur GitHub ce qu’il prétend être le code de son algorithme de recommandation de tweets.
Le code, publié sous la licence publique générale GNU Affero v3.0, contient de nombreuses informations sur les facteurs qui font qu’un tweet a plus ou moins de chances d’apparaître dans la timeline des utilisateurs.
Dans un article de blog accompagnant la publication du code, l’équipe d’ingénieurs de Twitter (sans signature particulière) note que le système de détermination des « meilleurs Tweets qui s’affichent finalement sur la timeline Pour vous de votre appareil » est « composé de nombreux services et tâches interconnectés ». Chaque fois que l’écran d’accueil de Twitter est actualisé, Twitter extrait « les 1 500 meilleurs Tweets d’un ensemble de centaines de millions de Tweets », indique l’article.
La source la plus importante de ces tweets est constituée par les « sources du réseau », c’est-à-dire les utilisateurs qu’une personne suit. Les meilleurs tweets de cette pile sont classés en fonction de la probabilité d’engagement d’un utilisateur avec l’auteur du tweet ; plus cette probabilité est élevée, plus leurs tweets apparaissent dans « Pour vous ». Pour les « sources hors réseau », celles qui ne sont pas suivies par l’utilisateur, Twitter indique qu’il prend en compte les tweets qui ont attiré l’attention des personnes suivies par les utilisateurs et les tweets aimés par ceux qui aiment les tweets analogues à ceux de l’utilisateur.
Les personnes qui ont examiné le code ont déjà repéré des éléments qui soulèvent de nombreuses autres questions. Nombreux sont ceux qui les ont posés, naturellement, sur Twitter lui-même.
Parmi les autres éléments pris en compte pour un tweet, citons le fait qu’il date de moins de 30 minutes, qu’il contienne des images et qu’il provienne d’un « power user », ce qui, selon certains, signifie un compte vérifié « hérité ».
De réelles questions
Musk a tweeté à côté de l’article de blog de l’entreprise sur l’algorithme de recommandation, affirmant que le « test de base » sera de savoir si des « tiers indépendants » peuvent « déterminer, avec une précision raisonnable, ce qui sera probablement montré aux utilisateurs ».
Most of the recommendation algorithm will be made open source today. The rest will follow.
Acid test is that independent third parties should be able to determine, with reasonable accuracy, what will probably be shown to users.
No doubt, many embarrassing issues will be… https://t.co/41U4oexIev
— Elon Musk (@elonmusk) March 31, 2023
La publication par Twitter du code de son algorithme intervient quelques jours seulement après la découverte sur GitHub d’un code source plus large du réseau social, qui pourrait s’y trouver depuis des mois, selon le New York Times. Twitter a alors obtenu une citation à comparaître obligeant GitHub à révéler les informations de l’afficheur de GitHub.
Le code arrive quelques heures avant que les utilisateurs « vérifiés » — ceux qui recevaient une coche bleue pour indiquer leur authenticité ou leur notoriété avant l’achat du service par Musk — ne soient plus vérifiés au profit des abonnés payants de Twitter Blue. Si certains utilisateurs liés à des gouvernements ou à de grandes organisations peuvent demander à bénéficier de coches d’autres couleurs, seuls les abonnés à Twitter Blue, au prix de 8 euros par mois, bénéficieront d’un « classement prioritaire dans les conversations », parmi d’autres fonctionnalités.