可视化采集软件火车浏览器的循环逻辑
作者:dong 发布于:2016-6-16 16:31 Thursday 分类:官方公告
可视化采集软件火车浏览器在编辑脚本的过程中需要对逻辑进行一系列设定,比如条件判断、循环、跳转、引用等,但对逻辑的操作需要渗透理解,这里就对于循环逻辑的具体操作简单讲解下,介绍自己的经验,希望帮助朋友们解决使用中遇到的问题。
首先我们仔细看一下循环的基本功能:无限循环、点击元素或列表、遍历List变量的列表等。
1.无限循环:即将循环内容步骤进行无限次的循环运行。
2.点击一个固定的元素:循环点击一个固定的xpath,比如翻页时,需要点击'下一页'这个元素时,就可以使用此功能。
3.点击一组固定的元素:选择点击一组固定的元素,并在空白框中写上xpath 后,会循环点击所有符合空白框中xpath 的元素。下面介绍一个简单的示例,示例地址:http://www.rrdiaocha.com/Survey/show_EDAE0C9CDEC7D0D6F7472615CA083CB9_50590726357083_50591439627395_16.html,点击问题5的多选框,点击图示多选框,首先需要在火狐浏览器中分析下多选框会匹配的xpath:
如上图xpath 可以通配该问题的所有答案://table[@id="tableinfo50590738299290"]//tr/td/input,将此xpath写在循环中,就会从上至下,点击所有符合该xpath 的元素。
4.点击指定的元素列表
在勾选了只读的list 变量中,写上你需要点击的xpath ,一行一个,这样就会循环点击该list 变量中的xpath。
网络爬虫火车浏览器的元素操作之写值
作者:dong 发布于:2016-5-26 11:56 Thursday 分类:官方公告
本文就网络爬虫工具火车浏览器软件的元素操作“写值”的功能作详细的介绍,帮助大家更好的使用软件完成更多的复杂工作。
一、功能介绍
1.Xpath提取规则:其中写的内容是Xpath,使用火车浏览器中的标记元素标记你想要获取的目标位置便可。这种适用于简单的xpath,如果不能成功定位的话,请在火狐浏览器中安装附件组件后分析。(http://bbs.locoyposter.com/forum.php?mod=viewthread&tid=14&highlight=%BB%F0%BA%FC)
2. :在用标记元素获取所需位置的xpath时,页面中若有多个可以满足的Xpath,则其余Xpath便在此处显示。用户可以根据自己的需求选择合适的Xpath。
3.:Xpath中可以使用变量,这里可以选择你所建立的变量,需注意此处只支持文本型变量以及计数器变量。
4.备选提取规则:按一行一个Xpath的格式填写,当Xpath提取规则查找不到元素时,会使用备选提取规则中Xpath,从上之下,直至有可查找到内容的Xpath,则调用该Xpath。
5.索引:点击测试查找元素之后,索引中显示网页中共有几条相同的Xpath,在出现有多条索引的时候,则说明,Xpath可匹配多个位置。若索引处为灰色,则说明当前页面此Xpath为唯一。
6.随机选取:当页面中有多条相同的Xpath时,勾选此选项,运行时会随机选取一个Xpath。
7.输入文本:此处可使用变量,可使用多个变量。
8.输入方式:向输入框不同的属性中写值。具体选择哪一个需根据 实际情况判断。
9.延时等待:等待事件执行完成。
10.写值前触发onclick事件:有些输入框触发条件是onclick点击事件,勾选便可在写值前触发此事件。
二、应用场景(特殊)
1.下拉框点击选值时,当这个下拉框是select-option类型的选择列表时,可以用写值来进行选择。 例如:http://post.58.com/837/45/s5?PGTID=152522969188409405254865176&ClickID=1
此网站中的类别就是select-option类型
下面具体介绍操作流程:
(1)在火车浏览器中打开网址
(2)使用标记元素标记类别选择框,写值界面会变成:
如上图会出现获取列表框的值这个选项,点击该选项后,会弹出右边查看列表框的值,其中列表框的值与对应设置的值是左右一一对应的,你想要输入列表框的哪一个选项,就对应在输入文本框中输入对应设置中的哪一个值。若是勾选随机选取,则会随机选择一个设置。
注意:只有select-option类型的下拉框才会出现如图示的获取列表框的值。若是其他类型的下拉框则不适用,需另寻方法如直接写值或者模拟点击,具体根据实际情况定。
2. 使用写值方式来上传文件。
文件上传现在可以直接使用写值的方式上传文件,下面介绍下具体的用法:使用方法很简单,只要使用浏览器的标记元素获取上传路径的xpath,并在输入文本中写上完整的图片路径(可使用变量)即可,设置类似下图:
注意:
(1)目前只支持type=file,也就是不支持flash上传,后续开发支持。
(2)若是用浏览器的标记元素不能取到正确的路径,请在火狐中分析上传的路径,一般路径都是//input [@...]形式,需要注意的是Tag中需要手动填写:“input;file”。
(3)图片路径中请尽量避免使用中文,有可能会产生bug 。
(4)确保路径可以正确访问,否则会提示上传失败。
网络爬虫火车浏览器写值的操作示例大致就是这些了,大家还有不明白的可以联系官方客服为您解答。
网络爬虫火车浏览器特色功能之生成exe程序
作者:dong 发布于:2016-4-26 14:50 Tuesday 分类:官方公告
火车浏览器软件不仅可以用来做脚本和项目管理,从而实现采集等web操作需求,还有一些与众不同的功能,其中之一就是可以让用户自助生成exe程序,用户生成的程序是可以自行销售给他人使用的。下面一起学习一下如何打包生
成exe程序.
打开火车浏览器软件的脚本编辑器,在工具菜単下有一个exe打包生成器,该工具可以将我们的脚本和浏览器进行打包,以单独的新产品面貌展现给用户,方便我们自已开发好脚本块卖给客户,也可以方便自己多台电脑布置采集任务。
如图,新建一个项目,我们可以设置新生成的软件名称、软件图标、还有关于生成者的介绍。这样生成的程序和一般我们使用的程序在功能上几乎没有什么区别。打包的软件名称要求是中文,版本号可以根据生成者的意愿填写1.0、1.2、2.3这样的数字。
那么打包的exe是何种授权方式呢?免费版的可以任意使用,试用版的最
多使用30天,授权版的是使用机器码,可以设置使用的时间长度。其中,软件识別码是从官方授权管理系统得到的,可以实现自动升级,免费版的软件识别码是固定的32个“0”。
生成设置可以选择不同的模板,简单任务不需要传入任何变量, 批量査询模板为选择一个文本文件, 文本文件中每一行都是一个“关键词”变量。然后用文本中的“关键词”変量替换脚本中的変量,进行批量的査询:群发文章模板为选择一个文件夹,文件夹中的所有txt文本都做为-个文章来发布。文章是文件名,文章内容是文件内容。可以选择发完就删除文本,也可以不删除,脚本中必须要有“标题”和“内容”两个交量。这里我们做批量査询的例子,就选择査询模板,将査询的关键词放在文本文件中,然后脚本中创建一个关键词変量,在生成的exe中就可以直接号入关键词文本,进行批量査询。
运行设置根据需要勾选显示内容和设置进程数和运行间隔,关于我们填写一些联系方式和说明文字即可。
附加数据,是生成exe时软件一并打包的文本夹或文件。其实我们自己复制也可以,但这个自动复制还是会比较方便的。那这些设置好以后,我们就可以通过软件的预览功能查看我们软件的样子了。
我们可以在预览那里填写文本查看实际运行的效果,等测试无误了,然后再生成exe,生成完成后,会打开目录。这样一个新的工具软件就出来了。我们做的例子是一个新闻采集的工具,只要更换脚本或是关键词,我们就可以做其他的工具。需要注意的是,脚本程序运行时,文本中运行的值运行一次以后,就会将历史记录保存在history.txt中,下次不会再运行,要再次运行,可以删除或是编辑history.txt文件。
用户在生成exe时只需要负责脚本和服务就可以了,由火车浏览器官方提供注册服务和自动升级。正如大家看到的,用户不仅可以使用火车浏览器实现自己的一系列web操作需求,更能自己做开发,获得盈利,甚至可以利用火车浏览器来做营销。因此火车浏览器不止是一款网络爬虫工具,更是一款万能的web操作神器,值得大家学习和使用。
联系我们
联系电话
-
0551-62864156
QQ邮件订阅
最新评论
- industrialegy
<a href="http://www.... - inve
这个采集到的视频地址 应该不是真实地址... - 云南桥架厂
我能说这个妹不错么 - 密密麻麻
win10 64位,处理后会留下原压缩包... - 平行进口车
以前经常用火车,来支持一下。 - 天津网站建设
文章采集器,厉害了 - 骗子医院
这个可以试试! - qq昵称
这么好的帖子,必须顶起来!! - 哈尔滨舒家网
试用一下,看是否能用。希望能用。火车头业... - 誉非
这个下载下来是安装程序,不是视频教程啊。