做小说站,最重要的就是采集。以前在群里曾听有个哥们说,几百上千章小说,就直接一个一个在后台复制、粘贴,我的乖乖呀…… 累死球啦~
当然做WordPress小说站,使用采集的方式很多,光我知道的,可以使用的采集程序就有“火车站采集器”、“亚普采集器”和“ET2”等等,这些都需运行在windows系统。如果有win的vps的话,使用亚普的话,可以实现全自动采集。
如果是linux的服务器,那么不好意思,没法用采集器。还有一点,当你不在电脑旁,也就没法更新你的小说。
正是基于这种情况,决定自己写一个简单的,可以用在php环境下的采集器。当然也可以在手机实现采集,我把这个采集器嵌入到WordPress单本小说主题DanXs2.0中。如下图所示:
[caption id="attachment_3539" align="alignnone" width="600"] Wordpress采集程序[/caption]
简单说一下,程序的功能:
1、可以采集gbk和utf8两种源码格式的小说。
2、实现分区域采集。
3、实现多页采集。
4、支持采集内容发布到某一分类id。
5.支持某一自定义字段
6、可过滤不必要的标签。
7、加入采集判断重复功能。
目前尚未实现定时采集功能,不过如果是linux的vps,那么可以使用cron定时服务功能。
还有一个功能没有实现,那就是多线程,就是像火车头的可以新建多个任务。
演示效果,请移步“完美世界” http://wanmeishijie.ikxs.org 查看!
我也想搞个这个。。
分享出来,给个下载链接。
只是几段php代码,目前不提供下载。
可以分享一下这个php采集器的代码吗?
不好意思,目前还不想公开。
这个也提供下载么?
沙发妥妥的,除了小说还可以其它的么?
别的也可以,不过别的没啥必要! 写个采集只是为了,没有电脑的时候,可以用手机去更新网站的小说哈。。呵呵。