Gmail 的人工智能垃圾邮件检测是多年来最大的安全升级

盖蒂图片社| com.pagadesign

最后发表于谷歌安全博客详细介绍了 Gmail 垃圾邮件过滤器的新升级，Google 称之为“近年来最大的防御升级之一”。此次升级以名为 RETVec（高效灵活文本向量）的新文本分类系统的形式出现。谷歌表示，这可以帮助理解“恶意文本操纵”——充满特殊字符、表情符号、拼写错误和其他不需要的字符的电子邮件，这些字符以前可以被人类阅读，但机器无法轻易理解。此前，充满特殊字符的垃圾邮件很容易突破Gmail的防御。

如果您想要“恶意文本操作”的示例，下面的消息来自您的垃圾邮件文件夹。我个人使用 Gmail 处理这些电子邮件的经验是，上半年这是一个大问题，因为这样的电子邮件经常到达我的收件箱。 RETVec 的技术升级似乎正在发挥作用，因为在过去的几个月里，这样的电子邮件对我来说根本不是问题。

整理这样的电子邮件非常困难，虽然任何垃圾邮件过滤器都可能扫描到这样一封电子邮件：“恭喜！您的头奖帐户可获得 1,000 美元积分”，但这并不是该电子邮件的实际内容。这里的很大一部分字母是“同音字“深入研究 Unicode 标准的无尽深度，您会发现一些晦涩的字符，它们看起来像是常规拉丁字母的一部分，但实际上并非如此。

例如，主题“𝐂𝐡𝐞𝐜𝐤_𝐘𝐨𝐮𝐫_𝐀𝐜𝐜𝐨𝐮𝐧𝐭”看起来奇怪地粗体，不是因为它有一个大胆的设计，而是因为它使用像“粗体大写数学 c“。这是一个数学符号，对人们来说看起来像字母“C”，但垃圾邮件过滤机器人严格地将其视为数学符号，并且不理解其英文含义。您越仔细地查看这样的电子邮件，情况越糟糕：它包含“零上的“C0NGRATULATIONS”替换了“O”字符之一，“Jᴀ̲ᴄ̲ᴋ̲pot”中的下划线字符非常奇怪，以至于它们甚至不会出现在Unicode搜索中，并且交换了很多空格句点或下划线。结果是垃圾邮件过滤器会查找到此混乱从电子邮件来看，基本上放弃了。（我不明白为什么未读电子邮件被设置为“收件箱”而不是“垃圾邮件”，但我不负责。）

谷歌表示 RETVec 是为了拯救世界：“RETVec 经过训练，能够抵御字符级操作，包括插入、删除、拼写错误、同名字符、LEET 替换等。”RETVec 模型是在新字符之上进行训练的“可以加密所有字符和单词”的编码器。高效的 UTF-8。因此，RETVec 可以开箱即用地支持 100 多种语言，无需查找表或固定词汇量。”

谷歌表示，这里的效率很重要。使用“固定词汇量”或“查找表”进行同形词的替代方法使其操作资源密集。想象一下“Congratulations”的所有可能的拼写错误和用数字、数学符号、西里尔字母、希伯来语或表情符号替换一个或多个字母的拼写错误的列表，您将拥有几乎无穷无尽的列表。谷歌表示 RETVec 只有 200,000 个“而不是数百万个参数”，因此虽然谷歌的垃圾邮件过滤云可能大到足以运行任何东西，但它又足够小，甚至可以在本地计算机上运行。里特维克开源谷歌希望消除世界各地的欺骗攻击，因此即使是您本地的评论部分也可能有一天会触发它们。

RETVec 的工作方式似乎很像人类的阅读方式：它是一个 TensorFlow 机器学习模型，使用视觉“相似性”来确定单词的含义而不是实际的字符内容。谷歌显示相似度它使用相同的技术来识别猫的图像，因此将其变成世界上最酷的光学字符识别系统似乎是可行的。显然，这种方法带来了显着的改进，正如谷歌所说：“用 RETVec 替换 Gmail 垃圾邮件分类器之前的文本向量，使我们能够将垃圾邮件检测率比基线提高 38%，并将误报率降低 19.4%。”此外，RETVec 的使用使模型的 TPU 使用量减少了 83%，使 RETVec 的部署成为近年来最大的防御升级之一。”

谷歌表示，“在过去的一年里”，它一直在内部测试 RETVec，并且已经将其推广到您的 Gmail 帐户。

Wei Zhang

Wei Zhang 是 Eddiba.com 的撰稿人，主要关注新闻、政治、商业、科技、体育、娱乐及生活方式等领域。她致力于以清晰、准确且易于理解的方式报道时事动态，为读者提供有价值的信息与背景解读。她关注与公众生活密切相关的话题，注重事实呈现和内容可读性，帮助读者及时了解当前热点事件及其影响。

READ Sonic Superstars 的开发者解释了他们最终放弃 Green Hill Zone 的原因

Gmail 的人工智能垃圾邮件检测是多年来最大的安全升级

吉利发布雷神16合1智能电驱系统百公里实测电耗低至8.2千瓦时银河TT率先搭载

中国首家机器人学校在杭州启用首批30名“机器人学员”开启职业技能培训

京东MALL迎来首批“机器人员工” 具身智能加速落地线下零售

您可能错过了

吉利发布雷神16合1智能电驱系统百公里实测电耗低至8.2千瓦时银河TT率先搭载

世界人工智能大会规模全面升级华为、Kimi等企业集中展示AI创新成果

中国上半年绿色科技产品出口增长超30% 绿色产业国际需求持续释放

OpenAI首款硬件产品亮相：不是AI手机，而是一款面向开发者的智能宏键盘

發佈留言 取消回覆

更多报道

吉利发布雷神16合1智能电驱系统 百公里实测电耗低至8.2千瓦时 银河TT率先搭载

中国首家机器人学校在杭州启用 首批30名“机器人学员”开启职业技能培训

京东MALL迎来首批“机器人员工” 具身智能加速落地线下零售

您可能错过了

吉利发布雷神16合1智能电驱系统 百公里实测电耗低至8.2千瓦时 银河TT率先搭载

世界人工智能大会规模全面升级 华为、Kimi等企业集中展示AI创新成果

中国上半年绿色科技产品出口增长超30% 绿色产业国际需求持续释放

OpenAI首款硬件产品亮相：不是AI手机，而是一款面向开发者的智能宏键盘

發佈留言取消回覆

吉利发布雷神16合1智能电驱系统百公里实测电耗低至8.2千瓦时银河TT率先搭载

中国首家机器人学校在杭州启用首批30名“机器人学员”开启职业技能培训

吉利发布雷神16合1智能电驱系统百公里实测电耗低至8.2千瓦时银河TT率先搭载

世界人工智能大会规模全面升级华为、Kimi等企业集中展示AI创新成果