你如果要英文的语料,那可以:
PU系列语料:从http://iit.demokritos.gr/skel/i-config/downloads/下载
Ling-Spam语料:可从http://iit.demokritos.gr/skel/i-config/downloads/下载。
Spam Assassin语料:可从http://www.spamassassin.org获得
Spambase语料: 可从http://www.ics.uci.edu/~mlearn/MLRepository.html获得。
本人要在做垃圾邮件的研究,但是因为刚开始做,所以打算先做英文垃圾邮件过滤。
你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=3170029
[2005-08-02 00:00:00.0] 垃圾邮件之王金盆洗手
[2005-08-11 00:00:00.0] 微软承诺未兑现 Sender ID未能消灭垃圾邮件
[2005-09-30 16:52:19.0] 清华教授赵晓力:反垃圾邮件立法原则
[2005-08-03 00:00:00.0] 垃圾邮件行为解析
[2005-09-18 00:00:00.0] 丁磊要死磕垃圾邮件 风投20亿美元砸中国互联网