
Barracuda Networks utilise le ML de Databricks Lakehouse pour prévenir les attaques de phishing par e-mail à grande échelle
Remarque : cet article a été initialement publié sur le blog de la société Databricks.
74 % des entreprises dans le monde ont été victimes d'une attaque de phishing. Barracuda Networks est un leader mondial dans les solutions de sécurité, de livraison d'applications et de protection des données. Barracuda aide ses clients à lutter contre les attaques de phishing à grande échelle. L'entreprise a conçu un puissant moteur d'intelligence artificielle qui utilise l'analyse comportementale pour détecter les attaques afin de se protéger des acteurs malveillants.
Traiter les e-mails de phishing est difficile en raison de la sophistication des e-mails malveillants créés par les pirates aujourd'hui. Barracuda Networks utilise le Machine Learning pour évaluer et identifier les messages malveillants et protéger ses clients. En utilisant le ML sur la plateforme Lakehouse de Databricks, l'équipe de Barracuda a pu travailler beaucoup plus rapidement et bloque désormais des dizaines de milliers d'e-mails malveillants chaque jour, les empêchant d'atteindre des millions de boîtes mail chez des milliers de clients.
Fournir une protection complète des e-mails
L'équipe de Barracuda se consacre à la détection des attaques de phishing et à la sécurité de ses clients. L'entreprise y parvient en travaillant sur Microsoft Office 365 et en analysant le flux d'e-mails pour y déceler d'éventuelles menaces. Si une attaque est détectée, elle est immédiatement supprimée de la boîte mail avant que les utilisateurs ne s'en aperçoivent.
Protection contre l'usurpation d'identité
L'un des produits majeurs proposés par Barracuda est la protection contre l'usurpation d'identité. L'usurpation d'identité se produit lorsque des acteurs malveillants se font passer pour des sources officielles, comme un cadre dirigeant ou un service connu. Les pirates peuvent utiliser cette attaque pour accéder à des informations confidentielles, ce qui représente un risque important pour les particuliers comme pour les entreprises.
La protection contre l'usurpation d'identité vise à dissuader les attaques de phishing ciblées. Ces tentatives ne sont pas envoyées en grand nombre, contrairement aux spams. Pour envoyer une attaque ciblée, le pirate doit disposer d'informations personnelles sur le destinataire afin de la personnaliser, telles que sa profession ou son domaine de travail. Pour identifier et bloquer les attaques de phishing par usurpation d'identité, l'équipe a dû créer un ensemble de modèles de classification et les déployer en production pour nos utilisateurs.
Difficultés avec la conception des fonctionnalités
Afin de former correctement nos modèles d'IA à détecter les attaques de phishing et d'usurpation d'identité, Barracuda avait besoin d'utiliser les bonnes données et d'effectuer une conception des fonctionnalités en plus de ces données. Les données comprenaient le texte de l'e-mail, qui pourrait être un signal d'attaque de phishing, ainsi que des données statistiques, telles que les détails sur l'expéditeur de l'e-mail. Par exemple, si un utilisateur reçoit un e-mail contenant une facture de la part d'une personne qui n'a pas envoyé d'e-mail similaire au cours des derniers mois, cela peut signaler un risque d'attaque de phishing. Avant l'intégration avec Databricks, la création de fonctionnalités était plus difficile car les données étiquetées étaient réparties sur plusieurs mois, en particulier les fonctionnalités statistiques. De plus, il était difficile de suivre les fonctionnalités lorsque notre ensemble de données augmente considérablement.
Lenteur du déploiement
Notre équipe a séparé le code et la modélisation et a dû dupliquer le code de recherche pour l'environnement de production, ce qui a pris du temps et de l'énergie. Nous faisions d'abord passer chaque e-mail entrant par le code de prétraitement, puis nous transmettions les e-mails prétraités à la modélisation pour en tirer des conclusions.
Barracuda réussit grâce à Databricks
L'équipe de Barracuda a tiré parti du Machine Learning sur la plateforme Lakehouse de Databricks, en particulier en utilisant le Feature Store et Managed MLflow, pour améliorer le processus de ML et déployer plus rapidement des modélisations de meilleure qualité.

(image zoomée ici)
Feature Store
Databricks Feature Store sert de référentiel unique pour toutes les fonctionnalités utilisées par l'équipe de Barracuda. Pour créer et gérer des fonctionnalités statistiques constamment mises à jour avec de nouveaux lots d'e-mails entrants, les données étiquetées ont été utilisées dans la conception des fonctionnalités. Étant donné que Feature Store est construit sur Delta, aucun traitement supplémentaire n'est nécessaire pour convertir les données étiquetées en fonctionnalités et ces dernières restent à jour. Les fonctionnalités sont conservées dans un référentiel hors ligne et des résumés de ces informations sont ensuite diffusés en ligne pour être utilisés afin de tirer des conclusions en ligne. En outre, en intégrant Databricks Feature Store à MLflow, ces fonctionnalités peuvent être facilement appelées à partir des modélisations dans MLflow, et la modélisation peut obtenir la fonctionnalité en même temps que la récupération de la fonctionnalité lorsque l'e-mail arrive pour être traité.
Opérations de Machine Learning plus rapides
Autre avantage : la gestion de toutes les modélisations de Machine Learning dans MLflow. Avec MLflow, l'équipe peut déplacer tout le code dans la modélisation, et donc laisser l'e-mail passer par la modélisation pour être traité au lieu de le prétraiter par du code comme c'était le cas auparavant, ce qui permet de tirer des conclusions sur la nature de l'e-mail plus rapidement. En utilisant MLflow, l'équipe de Barracuda est en mesure de construire des modélisations entièrement autonomes. Cette capacité réduit considérablement le temps que l'équipe consacre au développement de modélisations de ML.
Taux de détection plus élevé
Avec Databricks, l'équipe dispose de plus de temps et de calculs qui lui permettent de publier fréquemment de nouvelles tables dans Delta, de mettre à jour les fonctionnalités chaque jour et de les utiliser pour savoir si un e-mail entrant est une attaque ou non. Cela se traduit par une plus grande précision dans la détection des attaques de phishing et l'amélioration de la protection et la satisfaction des clients.
Impact
Grâce à Databricks, Barracuda protège les utilisateurs contre les attaques par e-mail dans le monde entier. Chaque jour, l'équipe bloque des dizaines de milliers d'e-mails malveillants et les empêche de tomber dans les boîtes mail des clients. L'équipe a hâte de pouvoir continuer à implémenter de nouvelles fonctionnalités de Databricks pour améliorer davantage l'expérience de nos clients.
Essayez Databricks gratuitement

Pour découvrir comment protéger votre entreprise contre les dernières menaces, contactez notre équipe d'experts pour une démonstration ou un essai gratuit de Barracuda Email Protection.

Rapport 2025 sur les ransomwares
Principales conclusions concernant l’expérience et l’impact des ransomwares sur les organisations du monde entier
S’abonner au blog de Barracuda.
Inscrivez-vous pour recevoir des informations sur les menaces, des commentaires sur le secteur et bien plus encore.

Sécurité des vulnérabilités gérée : correction plus rapide, risques réduits, conformité simplifiée
Découvrez à quel point il peut être facile de trouver les vulnérabilités que les cybercriminels cherchent à exploiter