可视化采集软件火车浏览器的循环逻辑

作者:dong 发布于:2016-6-16 16:31 Thursday 分类:官方公告

可视化采集软件火车浏览器在编辑脚本的过程中需要对逻辑进行一系列设定,比如条件判断、循环、跳转、引用等,但对逻辑的操作需要渗透理解,这里就对于循环逻辑的具体操作简单讲解下,介绍自己的经验,希望帮助朋友们解决使用中遇到的问题。

首先我们仔细看一下循环的基本功能:无限循环、点击元素或列表、遍历List变量的列表等。


1.无限循环:即将循环内容步骤进行无限次的循环运行。

2.点击一个固定的元素:循环点击一个固定的xpath,比如翻页时,需要点击'下一页'这个元素时,就可以使用此功能。

3.点击一组固定的元素:选择点击一组固定的元素,并在空白框中写上xpath 后,会循环点击所有符合空白框中xpath 的元素。下面介绍一个简单的示例,示例地址:http://www.rrdiaocha.com/Survey/show_EDAE0C9CDEC7D0D6F7472615CA083CB9_50590726357083_50591439627395_16.html,点击问题5的多选框,点击图示多选框,首先需要在火狐浏览器中分析下多选框会匹配的xpath

如上图xpath 可以通配该问题的所有答案://table[@id="tableinfo50590738299290"]//tr/td/input,将此xpath写在循环中,就会从上至下,点击所有符合该xpath 的元素。

 

4.点击指定的元素列表

    在勾选了只读的list 变量中,写上你需要点击的xpath ,一行一个,这样就会循环点击该list 变量中的xpath

在可视化采集软件火车采集器的逻辑中还有一个跳出本次循环,这个只有在循环内才可以使用,功能是不再执行此步骤下面设置的步骤内容,而是直接从下一个循环开始重新循环。比如一个循环,我们命名为第一次循环,第二次循环,第三次循环……,如果我们在第二次循环的时候运行了跳出本次循环的功能,则第二次循环中,跳出本次循环下面设置的步骤都不再运行,而是直接开始第三次循环。这与结束循环的概念是不同的,结束循环就是直接结束整个循环,这里需要大家注意一下。

标签: 火车浏览器 可视化采集软件

评论(0) 引用(0) 浏览(3936)

网络爬虫火车浏览器的元素操作之写值

作者:dong 发布于:2016-5-26 11:56 Thursday 分类:官方公告

本文就网络爬虫工具火车浏览器软件的元素操作“写值”的功能作详细的介绍,帮助大家更好的使用软件完成更多的复杂工作。

 

一、功能介绍

1.Xpath提取规则:其中写的内容是Xpath,使用火车浏览器中的标记元素8.png标记你想要获取的目标位置便可。这种适用于简单的xpath,如果不能成功定位的话,请在火狐浏览器中安装附件组件后分析。(http://bbs.locoyposter.com/forum.php?mod=viewthread&tid=14&highlight=%BB%F0%BA%FC

 

2. 1a.png:在用标记元素获取所需位置的xpath时,页面中若有多个可以满足的Xpath,则其余Xpath便在此处显示。用户可以根据自己的需求选择合适的Xpath

3.6a.pngXpath中可以使用变量,这里可以选择你所建立的变量,需注意此处只支持文本型变量以及计数器变量。

4.备选提取规则:按一行一个Xpath的格式填写,当Xpath提取规则查找不到元素时,会使用备选提取规则中Xpath,从上之下,直至有可查找到内容的Xpath,则调用该Xpath

5.索引:点击测试查找元素之后,索引中显示网页中共有几条相同的Xpath,在出现有多条索引的时候,则说明,Xpath可匹配多个位置。若索引处为灰色,则说明当前页面此Xpath为唯一。

6.随机选取:当页面中有多条相同的Xpath时,勾选此选项,运行时会随机选取一个Xpath

7.输入文本:此处可使用变量,可使用多个变量。

8.输入方式:向输入框不同的属性中写值。具体选择哪一个需根据 实际情况判断。

9.延时等待:等待事件执行完成。

10.写值前触发onclick事件:有些输入框触发条件是onclick点击事件,勾选便可在写值前触发此事件。

二、应用场景(特殊)

1.下拉框点击选值时,当这个下拉框是select-option类型的选择列表时,可以用写值来进行选择。 例如:http://post.58.com/837/45/s5?PGTID=152522969188409405254865176&ClickID=1

此网站中的类别就是select-option类型

2a.png

下面具体介绍操作流程:

1)在火车浏览器中打开网址

2)使用标记元素标记类别选择框,写值界面会变成:

3a.png

 如上图会出现获取列表框的值这个选项,点击该选项后,会弹出右边查看列表框的值,其中列表框的值与对应设置的值是左右一一对应的,你想要输入列表框的哪一个选项,就对应在输入文本框中输入对应设置中的哪一个值。若是勾选随机选取,则会随机选择一个设置。

注意:只有select-option类型的下拉框才会出现如图示的获取列表框的值。若是其他类型的下拉框则不适用,需另寻方法如直接写值或者模拟点击,具体根据实际情况定。

2. 使用写值方式来上传文件。

文件上传现在可以直接使用写值的方式上传文件,下面介绍下具体的用法:使用方法很简单,只要使用浏览器的标记元素获取上传路径的xpath,并在输入文本中写上完整的图片路径(可使用变量)即可,设置类似下图:


4a.png
注意:

   (1)目前只支持type=file,也就是不支持flash上传,后续开发支持。

   (2)若是用浏览器的标记元素不能取到正确的路径,请在火狐中分析上传的路径,一般路径都是//input [@...]形式,需要注意的是Tag中需要手动填写:“input;file”。

   (3)图片路径中请尽量避免使用中文,有可能会产生bug 。
   (4)确保路径可以正确访问,否则会提示上传失败。

    网络爬虫火车浏览器写值的操作示例大致就是这些了,大家还有不明白的可以联系官方客服为您解答。


标签: 火车浏览器 网络爬虫工具

评论(0) 引用(0) 浏览(5721)

网络爬虫火车浏览器特色功能之生成exe程序

作者:dong 发布于:2016-4-26 14:50 Tuesday 分类:官方公告

    火车浏览器​软件不仅可以用来做脚本和项目管理,从而实现采集等web操作需求,还有一些与众不同的功能,其中之一就是可以让用户自助生成exe程序,用户生成的程序是可以自行销售给他人使用的。下面一起学习一下如何打包生

成exe程序.

    打开火车浏览器软件的脚本编辑器,在工具菜単下有一个exe打包生成器,该工具可以将我们的脚本和浏览器进行打包,以单独的新产品面貌展现给用户,方便我们自已开发好脚本块卖给客户,也可以方便自己多台电脑布置采集任务。

 

如图,新建一个项目,我们可以设置新生成的软件名称、软件图标、还有关于生成者的介绍。这样生成的程序和一般我们使用的程序在功能上几乎没有什么区别。打包的软件名称要求是中文,版本号可以根据生成者的意愿填写1.0、1.2、2.3这样的数字。

    那么打包的exe是何种授权方式呢?免费版的可以任意使用,试用版的最

多使用30天,授权版的是使用机器码,可以设置使用的时间长度。其中,软件识別码是从官方授权管理系统得到的,可以实现自动升级,免费版的软件识别码是固定的32个“0”。

生成设置可以选择不同的模板,简单任务不需要传入任何变量, 批量査询模板为选择一个文本文件, 文本文件中每一行都是一个“关键词”变量。然后用文本中的“关键词”変量替换脚本中的変量,进行批量的査询:群发文章模板为选择一个文件夹,文件夹中的所有txt文本都做为-个文章来发布。文章是文件名,文章内容是文件内容。可以选择发完就删除文本,也可以不删除,脚本中必须要有“标题”和“内容”两个交量。这里我们做批量査询的例子,就选择査询模板,将査询的关键词放在文本文件中,然后脚本中创建一个关键词変量,在生成的exe中就可以直接号入关键词文本,进行批量査询。

运行设置根据需要勾选显示内容和设置进程数和运行间隔,关于我们填写一些联系方式和说明文字即可。



附加数据,是生成exe时软件一并打包的文本夹或文件。其实我们自己复制也可以,但这个自动复制还是会比较方便的。那这些设置好以后,我们就可以通过软件的预览功能查看我们软件的样子了。

我们可以在预览那里填写文本查看实际运行的效果,等测试无误了,然后再生成exe,生成完成后,会打开目录。这样一个新的工具软件就出来了。我们做的例子是一个新闻采集的工具,只要更换脚本或是关键词,我们就可以做其他的工具。需要注意的是,脚本程序运行时,文本中运行的值运行一次以后,就会将历史记录保存在history.txt中,下次不会再运行,要再次运行,可以删除或是编辑history.txt文件。

用户在生成exe时只需要负责脚本和服务就可以了,由火车浏览器官方提供注册服务和自动升级。正如大家看到的,用户不仅可以使用火车浏览器实现自己的一系列web操作需求,更能自己做开发,获得盈利,甚至可以利用火车浏览器来做营销。因此火车浏览器不止是一款网络爬虫工具,更是一款万能的web操作神器,值得大家学习和使用。

标签: 火车浏览器 网络爬虫

评论(0) 引用(0) 浏览(4837)

Powered by emlog