Tag Archives: 爬虫

blog的spam过滤技术

  发现有站点利用blog的引用通告发布了大量垃圾广告,登上来删了好半天。

  这个爬虫先搜索每篇blog,寻找特定的关键字,然后根据关键字提交不同的引用通告。这种类似Google广告的方式比垃圾邮件的变化多一些。看来不久就会出现针对blog的spam过滤技术了。