En mai 2022, deux entreprises spécialisées dans l'analyse des comptes Twitter, SparkToro et Followerwonk, ont mené une étude conjointe sur la proportion de comptes Twitter actifs étant fake ou spam. Selon cette analyse, environ 19,42% des comptes actifs (c'est-à-dire ayant tweeté au moins une fois dans les 90 derniers jours) répondent à des critères de faux comptes ou de comptes spam. Cette proportion est quatre fois plus élevée que l'estimation officielle de Twitter pour la fin de 2021. L'analyse détaillée incluait plusieurs jeux de données, dont un échantillon aléatoire de 44 058 comptes publics actifs et les followers de figures très médiatisées comme Elon Musk. Des techniques de machine learning ont été utilisées pour identifier les comptes suspects, en se basant sur 17 signaux corrélés au spam. Malgré une approche conservatrice afin de minimiser les faux positifs, l'étude révèle une réalité alarmante sur l'omniprésence des comptes inauthentiques sur la plateforme. Les auteurs insistent sur la transparence et la reproductibilité de leur méthode, invitant d'autres chercheurs à vérifier ou à compléter leurs résultats. Cet article offre non seulement des chiffres fascinants mais aussi une exploration approfondie des défis que pose la détection des faux comptes sur les réseaux sociaux. Pour plus de détails, y compris les implications potentielles pour l'acquisition avortée de Twitter par Elon Musk, lisez l'article complet.
Tout LIRE 👇L'analyse conjointe menée par SparkToro et Followerwonk en mai 2022 a révélé que près de 19,42% des comptes Twitter actifs sont des faux comptes ou des comptes de spam. Cette estimation est significativement plus élevée que celle de Twitter pour la fin de 2021.
Au cours de cette analyse rigoureuse, plusieurs jeux de données ont été examinés, y compris un échantillon aléatoire de 44 058 comptes Twitter publics récemment actifs. Ces comptes ont été sélectionnés de manière aléatoire parmi plus de 130 millions de profils publics actifs au cours des 90 derniers jours. L'étude, utilisant des techniques de machine learning basées sur 17 signaux associés au spam, visait à minimiser les faux positifs pour garantir des résultats précis.
Depuis trois ans, SparkToro propose un outil gratuit nommé "Fake Followers" pour analyser les profils Twitter. Ce dernier mois, de nombreuses organisations médiatiques ont utilisé cet outil pour examiner les abonnés d'Elon Musk, qui a suspendu son acquisition de Twitter en raison de préoccupations concernant la proportion de comptes de spam ou de faux comptes sur la plateforme.
Qu'est-ce qu'un compte Twitter de spam ou faux?
Selon SparkToro et Followerwonk, les comptes de spam ou faux sont définis comme ceux dont le contenu n'est pas régulièrement créé par un humain, qui ne consomment pas activement l'activité sur leur timeline, ou qui n'interagissent pas avec l'écosystème Twitter. Certains comptes automatisés, comme ceux qui partagent automatiquement des nouvelles, peuvent ne pas être considérés comme nuisibles, contrairement aux comptes de spam qui propagent de la propagande, vendent des produits, ou harcèlent les utilisateurs.
Quelle est la proportion de comptes de spam ou faux sur Twitter?
Pour obtenir une réponse complète, la même méthodologie a été appliquée sur cinq ensembles de données distincts :
- Échantillon aléatoire de Followerwonk (44 058 comptes) : Parmi les 130 millions de comptes récemment actifs indexés par Followerwonk, 19,42% se sont révélés être des comptes de spam ou faux.
- Moyenne agrégée de l'outil Fake Followers (~500K profils) : Cet ensemble comprend des comptes qui n'ont pas forcément tweeté récemment, offrant une comparaison utile.
- Tous les abonnés de @ElonMusk sur Twitter (93.4M comptes) : Analyse complète de près de 100 millions de comptes, retrouvant souvent des comptes plus anciens inactifs.
- Abonnés actifs de @ElonMusk (26.8M comptes) : Limite l'analyse aux comptes ayant tweeté au cours des 90 derniers jours pour une évaluation plus précise.
- Échantillon aléatoire de 100 utilisateurs suivant @Twitter : Bien que cet échantillon soit moins significatif, il est inclus pour comparaison.
Quelle est la proportion de faux ou spam dans les abonnés de Elon Musk?
En utilisant une méthodologie similaire, l’analyse complète des abonnés d'Elon Musk a révélé qu’environ 70,23% de ses abonnés ne sont probablement pas des utilisateurs authentiques et actifs. Une analyse plus restrictive, considérant uniquement les abonnés ayant tweeté dans les 90 derniers jours, a trouvé que 23,42% étaient probablement des faux ou des comptes de spam, un chiffre proche de la moyenne globale estimée.
Pourquoi faire confiance à la méthodologie de SparkToro et Followerwonk?
Les ensembles de données analysés sont assez grands et leur processus est assez rigoureux pour que les résultats soient reproductibles par d'autres chercheurs avec un accès similaire aux données publiques. SparkToro et Followerwonk ont employé des signaux comme l'absence de photo de profil, le faible nombre de followers, et des modèles spécifiques d'activité pour identifier les comptes de spam.
Ce modèle, basé sur un apprentissage machine de milliers de comptes de spam connus et de comptes réels, tend à éviter les faux positifs, ce qui signifie qu'il définit de manière conservatrice les comptes comme spam ou faux.
En conclusion, cette étude, bien que préconisant une approche conservatrice, révèle des défis importants dans la détection des comptes inauthentiques sur Twitter et fournit des insights précieux pour de futures recherches dans ce domaine.