Grâce à son omniprésence sur les autres services de Google, les comptes Gmail sont devenus des cibles privilégiées pour les activités malveillantes, voire illégales. Il ne s’agit pas seulement de spam ou d’escroquerie par hameçonnage, car les e-mails peuvent également contenir des fichiers qui, une fois téléchargés et ouverts, pourraient compromettre les appareils et les fichiers des utilisateurs. C’est pourquoi Google redouble d’efforts pour empêcher que ces pièces jointes n’atteignent votre boîte de réception Gmail et le fait avec l’outil préféré de Google, le machine learning.
Évidemment, la diffusion de logiciels malveillants en joignant des documents infectés à des e-mails est l’une des plus vieilles astuces du monde. Ce n’est pas seulement un risque théorique : les vrais hackers utilisent en permanence des documents malveillants pour infecter leurs cibles. C’est pourquoi, en plus de ses efforts de lutte contre le spam et le phishing, Gmail a étendu ses capacités de détection des logiciels malveillants à la fin de l’année dernière pour inclure un suivi plus personnalisé des documents. Et cela fonctionne.
Il n’est pas surprenant que Google scanne les e-mails qui transitent par ses serveurs et surtout ceux qui y arrivent. C’est en partie ce que vous acceptez lorsque vous utilisez le service, gratuitement ou non, à la fois pour améliorer Gmail et pour aider à filtrer le spam ou même à organiser vos e-mails en catégories. Et ce n’est pas seulement l’e-mail lui-même qui est traité, mais même les pièces jointes qui peuvent en fait faire plus de mal par elles-mêmes.
Lors de la conférence sur la sécurité de la RSA à San Francisco ce mardi, Elie Bursztein, responsable des enquêtes sur la sécurité et la lutte contre les abus chez Google, a présenté les résultats de la comparaison entre le nouveau scanner de documents de l’apprentissage en profondeur et les 300 milliards de pièces jointes qu’il doit traiter chaque semaine. Il est difficile de distinguer les documents légitimes dans toutes leurs variations infinies de ceux qui ont été spécifiquement manipulés pour cacher quelque chose de dangereux. Google affirme que 63 % des documents malveillants qu’il bloque chaque jour sont différents de ce que ses systèmes ont marqué la veille. Mais c’est exactement le type de problème de reconnaissance des formes où un apprentissage profond peut être utile.
Actuellement, 56 % des menaces de logiciels malveillants contre les utilisateurs de Gmail proviennent de documents Microsoft Office, et 2 % de fichiers PDF. Au cours de ses mois d’activité, le nouveau scanner a augmenté de 10 % sa détection quotidienne de documents Office malveillants.
Des améliorations notables
Bien qu’une augmentation de 10 % de la détection ne semble pas beaucoup, il s’agit d’une amélioration massive à l’échelle sur laquelle travaille Google, et tout gain est productif étant donné que la menace des documents malveillants est une réelle préoccupation dans le monde entier. Selon Bursztein, les entreprises et les organisations à but non lucratif ont trois fois plus de chances d’être ciblées par des documents malveillants que les autres organisations, et les entités gouvernementales cinq fois plus. Certaines industries sont également plus susceptibles que d’autres d’être ciblées. Les transports publics et les services d’infrastructures critiques, par exemple, présentent un risque beaucoup plus élevé que le secteur de l’éducation.
La prévalence des attaques de documents malveillants varie dans le monde entier, mais pour les hackers, l’approche est toujours une option. Bursztein note que des kits permettant de fabriquer des documents malveillants et de les adapter pour échapper aux scanners d’antivirus sont facilement disponibles en ligne, dont le prix varie entre 400 et 5 000 dollars.
Bien que le scanner capture plus de documents malveillants que jamais, Bursztein et ses collègues continueront à l’affiner dans l’espoir de bloquer une part encore plus importante des logiciels malveillants envoyés aux comptes Gmail dans le monde entier. Le nouveau scanner de pièces jointes en est encore à ses débuts, et il a encore beaucoup de place pour se développer.