做小说站,最重要的就是采集。以前在群里曾听有个哥们说,几百上千章小说,就直接一个一个在后台复制、粘贴,我的乖乖呀…… 累死球啦~

当然做WordPress小说站,使用采集的方式很多,光我知道的,可以使用的采集程序就有“火车站采集器”、“亚普采集器”和“ET2”等等,这些都需运行在windows系统。如果有win的vps的话,使用亚普的话,可以实现全自动采集。

如果是linux的服务器,那么不好意思,没法用采集器。还有一点,当你不在电脑旁,也就没法更新你的小说。

正是基于这种情况,决定自己写一个简单的,可以用在php环境下的采集器。当然也可以在手机实现采集,我把这个采集器嵌入到WordPress单本小说主题DanXs2.0中。如下图所示:

[caption id="attachment_3539" align="alignnone" width="600"]Wordpress采集程序 Wordpress采集程序[/caption]

简单说一下,程序的功能:

1、可以采集gbk和utf8两种源码格式的小说。

2、实现分区域采集。

3、实现多页采集。

4、支持采集内容发布到某一分类id。

5.支持某一自定义字段

6、可过滤不必要的标签。

7、加入采集判断重复功能。

目前尚未实现定时采集功能,不过如果是linux的vps,那么可以使用cron定时服务功能。

还有一个功能没有实现,那就是多线程,就是像火车头的可以新建多个任务。

演示效果,请移步“完美世界”  http://wanmeishijie.ikxs.org 查看!

Last modification:April 11th, 2020 at 09:18 pm
如果觉得我的文章对你有用,请随意赞赏