自从互联网上出现垃圾邮件这一事物起,反垃圾邮件的技术便应允而生,早期的反垃圾邮件技术基本上是以IP阻断列表以及黑名单技术为主,之后逐渐发展为内容过滤等过滤技术,但这些技术从过滤思想上来讲,属于传统的反垃圾邮件技术,存在着不可逾越的鸿沟,无法满足目前互联网上形形色色的垃圾邮件。
垃圾邮件内容关键字过滤技术
当今反垃圾邮件市场上,以内容过滤技术为主导技术的产品很多,内容过滤技术是指对接收到的邮件内容进行全文检索,通过和反垃圾邮件系统上建立的庞大的内容过滤规则库(一般情况下是在3-5万条左右)中关键字规则进行比对,区分出垃圾邮件内容。
内容过滤产品的出现虽然突破了IP控制和黑名单技术的一些技术瓶颈,但从过滤思想与过滤技术上针对社科院的实例应用也存在问题:
消耗系统资源与网络带宽
由于内容过滤技术是对邮件进行全文检索,所以所有外来邮件流量都必须接收,再经过关键字匹配、区分,然后才可以正常投递给邮件服务器。即使是一封正常信想经过网关投递给邮件服务器,也必须经过上万条规则的逐个扫描才可以正常投递。所以从效率上来讲是比较消耗系统与网络带宽的,在大规模垃圾邮件攻击来临的时候,还有可能出现邮件传递滞后、堵塞的现象。
垃圾邮件识别率较低
内容过滤技术的原理可以认为是规则匹配型过滤,假如一封邮件具备规则库的某条过滤规则,反垃圾邮件系统会根据相关的策略进行处理。近来垃圾邮件除了发送量的递增,内容变化频率升高也成为一个比较明显的特征,垃圾邮件发送者会对邮件的信头以及信体的内容进行变换发送,甚至以分钟或秒为单位实时变换。要抵挡大规模的垃圾邮件攻击,社科院依然需要人为分析垃圾邮件内容的特征并及时进行规则库的更新。文字内容的变化方式多样,不同的文字可以表达相同的意思。及时的跟踪垃圾邮件的内容变化讲消耗大量的人力、财力。同时,随之垃圾邮件的发展趋势,垃圾邮件发送者在邮件服务器针对邮件的内容进行扫描,导致无法将垃圾邮件顺利投递时,开始将文字内容以图片格式进行发送,目前的内容过滤技术无法达到对图片内文字的扫描与识别,所以大量的垃圾邮件依然会成为漏网之鱼投递给邮件服务器。
内容过滤技术误判率较高
内容过滤规则的定义一般是定义邮件主题或者是邮件内容等,包含有某关键字的时候就会按照相关策略进行处理,或丢弃或拦截。但正常邮件也有可能会出现被规则库所定义过的关键字,自然也会
↓下一篇:


