如何看待文章采集这个事的?站长对采集的态度,决定了网站发展
在seo这个行业,采集不认为是可耻的事情,尤其对站长这种双标的“职业”来说,别人都是菜鸟,自己才是大神这一套理论跟一边劝说别人不要采集,转头自己采集的比谁都欢这种做法如出一辙,所以,不要有心理负担,开着采集器就行了。
一、为什么一定要采集?
我简单地理解为,人的趋利和懒惰这两个方面,你看过不少大站,权重可以达到6-7.然后你再看人家的文章id,已经排序到几百万的数据量了,按照一个正常编辑的工作量,就算一天10篇原创内容,从不休息,一年也只能生产3650篇文章,如果达到一百万的内容量,换句话说,你要花费274年,也就是说,一个正常的、又会写的,要从清朝乾隆十二年开始到现在,才能完成如此大的工作量,所以,人工生产海量的内容,完全不现实。你也许就能理解为什么现在那么多人喜欢采集,完全是为了不想祸害自己的下4代人。
从另外一个角度来讲,如果说一篇文章能给你带来1个访客,那么你肯定就想越多越好,所以就造就了这个局面,一切多多益善。
二、为什么你采集起不来?
了解上面的采集借口,或许你更关心这样一个问题,为什么人家的采集起来了,我的就起不来,原因有这几个方面:
1、域名
2、页面质量
很多实验表明,一个站点评级不行,你采集的内容也不会收录排名,换句话说,你的采集起不来,多半是这些原因的,另外还值得说明的是,采集的内容不一定是垃圾内容,百度白皮书说的采集,只是针对垃圾内容采集惩罚,从这点来看,百度对采集的态度是很暧昧的。
如果说你的采集内容起不来,建议走优质内容路线,先把评级养起来再做采集内容处理,我的经验是多做增益页面内容,页面加随机url。
三、主流采集方法
目前主流采集方法有以下两种;
1、纯采集
使用采集软件某鱼、某数、某侠、某头、某铁等,直接写规则直接开采,一天下来可以达到上万篇,什么都不用动,开个定时任务就好。
2、组合采集
这类采集组合是采集过来的内容进行处理,标题加上长尾词,内容出现自定义段落。
四、采集如何应对?
如果你是采集的一方,那肯定爽歪歪的,从274年能缩短到不到1年都能完成工作量,你要感谢现在的科技,但如果你是被采集的一方,我知道你想死的心都有了,这里建议几个方法:
1、代码增加禁止f12,禁止右键复制。
2、采集的规则基本都是取唯一性,所以多加混淆ID,让采集规则失效。
3、和律师事务所或律师合作,做好法律申明,然后你懂的。
最后,虽然说采集可以减少工作量,但是仍然不建议去做纯采集的工作,因为不少大站虽然说数量起来了,但是收录率,词库很低,但有的优质站点,收录才1w,但权重和词库出词效果很好,所以,你应该明白了一些门道。