文章采集器采集规则和发布模块的对接

作者:dong 发布于:2016-7-6 15:21 Wednesday 分类:官方公告


对于网站维护人员来说,在配置完文章采集规则后,还需要配置发布模块,将采到的内容发布到网站中去。在线发布模块,就是文章采集器通过网站后台,发布文章,也就是将你手动在网站后台发布文章的整个过程包含登录网站后台,选择栏目,到发布文章,这些步骤都写到采集器里面就是在线发布模块,然后规则采集到的值就通过标签名传递给在线发布模块,把数据提交到网站里去。

那么在我们常用的文章采集器​即火车采集器V9中,要如何完成采集规则和发布模块的对接呢,新手朋友们请往下看。

采集规则.png

    如果要选择发布到网站中,就选择Web在线发布,然后勾选已经设置过的WEB配置就可以了。(如果大家还没有掌握发布模块的制作可以参见网页抓取工具火车采集器发布模块制作示例。)

    这里需要提醒大家注意的是:我们所设置的采集内容标签一定要和发布模块的标签个数以及名称都保持一致,否则会导致发布出错,如下图四个标签也对应四个同样的标签。

采集规则1.png

采集规则2.png

    完成以后在任务列表中勾选采集、发布,然后点击开始即可运行。在默认情况下,火车采集器会把采集的数据先保存到自己的数据库,然后根据用户设置的发布配置,再从数据库里面读出数据通过发布配置把数据发布出去。

    但我们也可以选择让采集器采集到的数据不保存到数据库,而是直接通过发布配置发布出去,也就是发布相关设置中的“边采集边发布”,发布时也可以选择正序倒序乱序等,主要看用户自己的使用需求了。


标签: 火车采集器V9 文章采集器

发表评论:

Powered by emlog