La détection de spam Gmail a reçu ses «plus importantes améliorations de défense depuis plusieurs années».

Bloquer les e-mails indésirables est une bataille constante et en évolution permanente, et la dernière technique de Gmail permet une amélioration de 38 % de la détection grâce à une meilleure identification du texte. Les spammeurs utilisent souvent des homoglyphes (caractères ressemblant de manière superficielle à des lettres réelles), des caractères invisibles, du bourrage de mots-clés et d’autres «manipulations adverses du texte» pour contourner les modèles de classification de texte de Gmail qui identifient les attaques par hameçonnage, les escroqueries et d’autres contenus dangereux. Google réplique avec RETVec (Resilient & Efficient Text Vectorizer). Open sourced par Google Research, cette approche «aide les modèles à atteindre les meilleures performances de classification et réduit considérablement le coût de calcul» tout en prenant en charge «toutes les langues et tous les caractères UTF-8 sans nécessiter de prétraitement du texte». Cela le rend idéal pour les cas d’utilisation sur appareil, web et autres à grande échelle: dans Gmail, RETVec a amélioré le «taux de détection des pourriels par rapport à la baseline de 38 %», tout en réduisant à la fois le taux de faux positifs (de 19,4 %) et l’utilisation de l’unité de traitement de tenseur (de 83 %). RETVec parvient à ces améliorations en arborant un modèle de plongée de mots très léger (~ 200k paramètres), ce qui nous permet de réduire la taille du modèle de transformateur à des performances égales ou supérieures, et de pouvoir diviser le calcul entre l’hôte et le TPU d’une manière efficace en termes de réseau et de mémoire.

Share the Post:

La détection de spam Gmail a reçu ses «plus importantes améliorations de défense depuis plusieurs années».

Related Posts

‘Vous devez croire que vous pouvez le réparer’

À l’intérieur de l’univers profondément geek – et incroyablement coûteux – de la collection d’accessoires de Hollywood.

‘TikTok et l’évolution du blackface numérique’

Ce ne sont pas seulement les robots : les emplois qualifiés passent à la « chair à saucisse ».

« L’histoire inédite : Comment l’iPhone a révolutionné l’industrie sans fil »

Revue : Motorola Edge 50 Pro

« Revue : Barre de son Klipsch Flexus Core 200 »

« Quel téléphone Motorola devriez-vous acheter? »