可视化采集软件火车浏览器的逻辑相关操作

作者:dong 发布于:2016-9-23 17:48 Friday 分类:官方公告

可视化采集软件火车浏览器​在编辑脚本的过程中需要对逻辑进行一系列设定,比如条件判断、循环、跳转、引用等,这里就对逻辑的具体操作简单讲解下,介绍自己的经验,希望帮助朋友们解决使用中遇到的问题。

图片1.png

条件判断有四种形式:1.条件判断:

1当前页面源码

图片2.png2xpathhttp://bbs.locoyposter.com/post-21-1-1.html

图片3.png

在使用变量判断的时候,选择判断方式必须要选择相等。3变量判断  

4使用代码片段

图片4.png

http://bbs.locoyposter.com/forum.php?mod=viewthread&tid=75&extra=page%3D1%26filter%3Dtypeid%26typeid%3D5判断值是否大于某个值等类似的判断。具体使用方法:

2.循环:

图片5.png

1在一个网址需要无限反复的采集或者填写的时候,可以使用到无限循环循环一般是稍复杂的脚本中都会用到,其功能是非常强大的。其中具体有以下几种:

2点击固定元素:当需要重复点击同一个元素的时候,比如点击下一页,便可以使用此功能

3点击一组固定元素:当需要依次点击页面中的一组元素时,用此功能。

4点击指定的元素列表:将需要点击元素的xpath 放在一个list变量中,再选用此功能,就可以依次点击list变量中的xpath。

5遍历list变量,需要访问的元素放在list变量中,然后使用循环去一一访问它,比如采集网页是,list变来那个中存放的是网址,那么循环遍历是,级那个每次比昂里的网址存放在一个文本型变量中,图示“保存至变量”步骤,设置一个变量来临时存储要访问的网址,然后将变量填入“打开网页”步骤的访问地址栏,这样就可以循环打开list变量中的网址.

6从数据库中查询数据:使用sql语句,调用数据库的数据。与列同名的变量可直接调用该列中的数据,所以使用下面的保存至变量。具体使用方法:

http://bbs.locoyposter.com/post-222-1-1.html

7循环执行次数:可以直接填写固定值或者使用计数器变量的值来控制循环次数。

3.跳转:跳转到其他步骤

图片6.png

5.结束循环:循环步骤结束4.跳出本次循环:跳出当前循环的步骤,进行下一个循环

提示(跳出循环与结束循环的区别)

跳出循环:比如有 5个数,当前循环到3,使用跳出循环,则不再进行循环3的步骤,跳出这个循环后从循环数字4开始再循环

结束循环:同样有 5个数,当前循环到3  使用结束循环,则循环结束,不再进行下面数字的循环。

6.暂停等待:这个步骤用到会比较多,有些网页打开加载比较慢(比如登录时,页面跳转时),就设置一个暂停等待的时间。等待的时间设置固定的时间,也可使用计数器变量或者随机时间。也可以使用网页中一个标志性的xpath,作为等待指定的元素,即网页中加载出这个元素后就进行下面的操作,比如一个网页中只需要进行写值时,就可以使用输入框xpath作为等待指定元素。

标签: 可视化采集软件 火车浏览器​

评论(0) 引用(0) 浏览(6152)

可视化采集软件火车浏览器的循环逻辑

作者:dong 发布于:2016-6-16 16:31 Thursday 分类:官方公告

可视化采集软件火车浏览器在编辑脚本的过程中需要对逻辑进行一系列设定,比如条件判断、循环、跳转、引用等,但对逻辑的操作需要渗透理解,这里就对于循环逻辑的具体操作简单讲解下,介绍自己的经验,希望帮助朋友们解决使用中遇到的问题。

首先我们仔细看一下循环的基本功能:无限循环、点击元素或列表、遍历List变量的列表等。


1.无限循环:即将循环内容步骤进行无限次的循环运行。

2.点击一个固定的元素:循环点击一个固定的xpath,比如翻页时,需要点击'下一页'这个元素时,就可以使用此功能。

3.点击一组固定的元素:选择点击一组固定的元素,并在空白框中写上xpath 后,会循环点击所有符合空白框中xpath 的元素。下面介绍一个简单的示例,示例地址:http://www.rrdiaocha.com/Survey/show_EDAE0C9CDEC7D0D6F7472615CA083CB9_50590726357083_50591439627395_16.html,点击问题5的多选框,点击图示多选框,首先需要在火狐浏览器中分析下多选框会匹配的xpath

如上图xpath 可以通配该问题的所有答案://table[@id="tableinfo50590738299290"]//tr/td/input,将此xpath写在循环中,就会从上至下,点击所有符合该xpath 的元素。

 

4.点击指定的元素列表

    在勾选了只读的list 变量中,写上你需要点击的xpath ,一行一个,这样就会循环点击该list 变量中的xpath

在可视化采集软件火车采集器的逻辑中还有一个跳出本次循环,这个只有在循环内才可以使用,功能是不再执行此步骤下面设置的步骤内容,而是直接从下一个循环开始重新循环。比如一个循环,我们命名为第一次循环,第二次循环,第三次循环……,如果我们在第二次循环的时候运行了跳出本次循环的功能,则第二次循环中,跳出本次循环下面设置的步骤都不再运行,而是直接开始第三次循环。这与结束循环的概念是不同的,结束循环就是直接结束整个循环,这里需要大家注意一下。

标签: 火车浏览器 可视化采集软件

评论(0) 引用(0) 浏览(3715)

Powered by emlog