福利来啦:6.8折优惠码太给力!

作者:dong 发布于:2017-5-8 10:21 Monday 分类:官方公告

五一劳动节刚刚过去,这三天里你是忙碌依旧还是游玩放松去了呢?说到劳动节,如果论起哪些人群最勤劳,那火车头的大神们肯定榜上有名。听闻许多大神为了快速get数据,电脑上都日夜运行着采集器,堪称采集劳模呀!

所以节日过后,给辛勤的你们来一波福利,五重钜惠不容错过,今后把采集都交给火车头,工作放松两不误 ╮( ̄▽ ̄)╭

活动时间:5月4日-5月15日

活动1:老用户享6.8折升级续费!

六百个6.8折优惠码,仅限老用户升级续费使用,明天(5月4日)8点30分准时开启,领完为止。

点此进入活动页领取

活动2:51元至351元,新购立减!

四百个51元—351元优惠码,金额随机,购买软件时即可使用。优惠码金额设置为:51、85.1、105.1、151、251、351元 。

注:251元及以上金额的优惠码需消费满800元方可使用。

领取方式:识别下方二维码关注火车采集器官方微信公众号,回复“采集劳模”即可。快去试试手气,一不小心就捡到钱!

活动3:致敬劳模,下单送礼!

礼品赠送:活动期间前51名下单的用户,实付达到规定金额即赠送相应礼品(升级、续费、新购软件均可参与)

礼品设置如下:

实付金额满500元

赠送乐维纪念鼠标垫或鸭舌帽一顶

实付金额满800元

赠送20元手机充值卡

实付金额满1000元

赠送500M流量包

实付金额满1500元

赠送50元手机充值卡

活动4:购火车采集器送火车浏览器!

活动期间,用户购买火车采集器软件(旗舰自动授权版及更高版本)即赠送火车浏览器旗舰版软件(半年使用权),两款软件结合使用,免费体验黄金组合的强大功能!

活动5:不用采集,数据包限时特惠!

不想学采集?不知从哪采?10组数据包限时优惠,即买即用,获取数据的方式原来不止采集~

1.阿里巴巴网站公司黄页数据(760万条) 

价格:4800元    原价:9600元 

2.全国4S店经销商数据(2万条)      

价格:350元      原价:700元

3.全国国产药品数据(16万条) 

价格:1500元    原价:3000元

4.全国禽类养殖农业合作社数据(9千条)

价格:650元      原价:1300元

5.全国食品有限公司企业数据(26万条) 价格:2600元    原价:5200元

6.全国渔具公司数据(1400条)   

价格:800元      原价:1600元

7.携程网全国景点库数据(4万条) 

价格:1500元    原价:3000元

8.携程世界酒店数据(45万条)  

价格:3500元    原价:7000元

9.58同城北京招聘数据(39万条)     

价格:3000元    原价:6000元

10.域名交易行情数据(200万)

价格:6500元    原价:13000元

活动规则

1、本次活动中所有面值和折扣优惠码均可自用或赠送他人使用。

2、本次活动所有优惠码不可与其他优惠活动同时享用。

3、本次活动以优惠码购买的软件,均不再赠送免费的采集规则和发布模块服务。

4、本次活动中发放的优惠码均有使用期限,请大家及时使用,过期作废。

5、合肥乐维信息技术有限公司保留本次活动最终解释权。

评论(0) 引用(0) 浏览(210)

火车采集器V9起始网址页即为内容页和标签循环采集功能使用

作者:dong 发布于:2017-4-19 14:39 Wednesday

今天给大家分享财富网股票业绩预告信息采集规则。今天的规则相对比较简单,但简单中又有技巧,  

比如看到这个图的规则,会不会晕呢,怎么就标点符号和通配符呢?今天的规则主要使用了起始网址页即为内容页和标签循环采集功能,下方案例讲解为大家详细说明。


【案例讲解】
今天主要讲解 起始网址页即为内容页和标签循环采集功能,其他略过!

我们要采集的网址:http://data.eastmoney.com/bbsj/201703/yjyg.html

 

如上图,我们需要采集表格中的信息。

 
底部有分页,总共29页,发现点击分页,网址并无变化,那就这就需要我们使用抓包软件Fiddler(学习抓包)来抓取真实地址,如下图:

 


通过抓包我们找到了有我们需要的数据的页面地址,我们将网址复制出来,参照下图:

 

通过网址规则分析到分页的参数变量,一般可以通过抓取多个分页的网址进行对比就知道哪个是分页变量了,找到变量规则后,我就可可以通过网址分页规则进行设置,共29页,如下图:

 

通过抓包软件,我们看到我们所要采的数据就在抓取的分页中,就并不需要再采集内容页,我们要的内容就在起始网址页中,那么我们就需要使用火车采集器的起始网址就是内容页网址,我们点击“点击设置”,如下图:

 

点击出现下图,是灰色的,不能进行任何设置,因为我们不需要设置采集内容页网址了,所以这里不操作。

 

直接进入内容采集规则设置界面,如下图,因为我们需要采的内容是表格内容并且都在一个页面上,所以我们需要使用循环采集,所以设置标签的时候,每个标签都要将循环匹配√选上。(每个标签的内容采集规则这里不多说,大家可以下载规则自行测试学习,其实还是有一定的小技巧的)

 

网页上的表格数据,一行一条信息,所以我们采集下来也是需要一行一条信息,那在左侧下方的循环设置中我们要进行设置,改为“添加新记录”,这样我们采集的信息就会一行一条,否则所有信息将堆积在一起,只有一条信息。参照下图:

 

设置好后我们进行测试,出现下图即为设置成功

 


另外讲下,在采集该页面信息进行循环时,发现第一条信息和其他信息的规则不一样,经过分析,只能循环采集每页的除第一条的其他信息。那这应该怎么办?这个没有更好的方法,页面数据规则太过简单,无法找到一个能够匹配所有信息的规则,解决方法只有一个笨方法,但是也是唯一可以解决此问题的。那就是先循环采集所有信息,然后再设一个规则只针对第一条信息,再采一次最后合并。这里分享的规则不能采集到第一条信息,大家可以按照我的思路去尝试采集第一条信息。
 


本案例规则下载:【东哥福利】火车采集器V9财富网业绩预告信息采集规则分享

评论(0) 引用(0) 浏览(427)

【东哥福利】豆瓣电影采集规则及发布到本地CSV格式文件

作者:dong 发布于:2017-3-23 10:45 Thursday 分类:强烈推荐

【东哥福利】今天为大家带来豆瓣电影采集规则,同时为大家讲解如何本地发布csv文件。
另外今天还给大家讲解如何通过fiddler抓包软件抓取网页真实网址。

文件包中包含两个规则文件,一个发布模板文件,请按照以下说明使用。

本规则为火车采集器V9版规则,其他低版本不可使用。
本规则采集豆瓣电影信息,本规则仅供学习参考,仅抓取其中一个类别,另因豆瓣有IP限制,本规则不能将全部数据采集下来,如需要采集更多数据,请自行配置IP资源。
规则文件“豆瓣电影 - 带发布csv配置(收费版可用).ljobx”带发布csv配置,但必须收费版方可使用
文件“豆瓣电影.csv"为发布csv模板,请将此文件复制到FileTemplate目录下
文件“豆瓣电影.ljobx”为免费版用户可使用的规则,不带发布配置
本规则仅供广大用户学习交流参考,不可用以违法目的或商业用途,我们不对因使用此规则造成的任何法律问题承担责任。

下载链接:http://bbs.locoy.com/spider-150886-1-1.html

 

商业版用户有问题或付费定制规则请联系官方客服QQ:800019423 服务热线:400-8757-060


【案例讲解】

本案例是采集豆瓣电影信息数据,网址https://movie.douban.com/
 
如上图,这种瀑布流形式的网页是无法直接看到数据列表的真实网址,需要借助抓包软件来抓取真实网址,我们这里是推荐使用Fiddler。

 

大家可以自行去下载该软件,然后打开软件,打开豆瓣电影页面,点击加载更多,抓包软件便会记录他的数据列表真实地址,如何找到该地址参照上图。
关于fiddler的使用教程:http://faq.locoy.com/search.html?keyword=fiddler
另外由于豆瓣使用的是https协议,fiddler软件需要进行设置方可抓取https协议的网址,设置方法参照:http://faq.locoy.com/q-1194.html

【如何设置发布数据到本地CSV格式】

 

如上图:内容发布规则设置,选择保存为本地文件,本地文件保存启用,文件格式选择csv,然后需要设置一个保存模板,下载附件中已经包含了应该模板文件,可以直接使用。(这里也简单提下如何制作模板文件,在我们的模板文件目录里有一个默认csv模板文件,可以直接复制一个另起一名,然后用记事本方式打开,再强调一下,一定要用记事本打开,然后按照自己的采集标签修改,字段名一定要与采集器内容采集中的标签名相同,字段之间的逗号一定要用英文逗号。)

 
如上图在其他设置里有个任务运行线程及时间,发布的线程可以修改,这可以加快发布的速度。


 

一切设置好之后,按照上图,可以把前面两√去掉,然后运行任务即可将数据保存到本地csv格式。


往期福利:


【东哥福利】美女图片采集规则及DZ3.X门户发布规则分享
【东哥福利】火车采集器58同城招聘信息采集规则分享

【东哥福利】火车采集器软件-今日头条娱乐新闻采集规则
【东哥福利】火车采集器V9携程景点采集规则分享
【东哥福利】火车采集器V9京东商城商品信息采集规则分享

火车采集器软件V9.3最新视频教程-YY直播课程录屏合集

联系我们
客服QQ:800019423
客服电话:400-8757-060


软件购买:http://www.locoy.com/buy

基础版:460(不含发票)506(含发票)
旗舰版(机器码版):880(不含发票)960(含发票)
旗舰版(自动授权版):1290(不含发票)1403(含发票)
企业版(尊享版):3380(不含发票)3660(含发票)
企业版(豪华版):7980(不含发票)8628(含发票)

标签: 采集规则分享

评论(0) 引用(0) 浏览(740)

【东哥福利】火车采集器V9京东商城商品信息采集规则分享

作者:dong 发布于:2017-3-9 14:01 Thursday

又到了每周 【东哥福利】的时间,今天给大家分享京东商城手机商品信息采集规则。今天的规则主要用到多页采集功能,需要学习这个功能的可以以此为案例进行学习。
 

 


下载地址:http://bbs.locoy.com/spider-150821-1-1.html


本规则仅供广大用户学习交流参考,不可用以违法目的或商业用途,我们不对因使用此规则造成的任何法律问题承担责任。

商业版用户有问题或付费定制规则请联系官方客服QQ:800019423


【东哥福利】


火车采集器V9携程景点采集规则分享

火车采集器软件-今日头条娱乐新闻采集规则

火车采集器58同城招聘信息采集规则分享

火车采集器软件V9.3最新视频教程-YY直播课程录屏合集

联系我们
客服QQ:800019423
客服电话:400-8757-060


软件购买:http://www.locoy.com/buy

基础版:460(不含发票)506(含发票)
旗舰版(机器码版):880(不含发票)960(含发票)
旗舰版(自动授权版):1290(不含发票)1403(含发票)
企业版(尊享版):3380(不含发票)3660(含发票)
企业版(豪华版):7980(不含发票)8628(含发票)

评论(0) 引用(0) 浏览(904)

火车浏览器开发SDK下载

作者:小文 发布于:2017-2-24 10:50 Friday 分类:软件培训

该SDK包含了sdk二次开发,自定义界面开发,插件开发多个文档。讨论QQ群:149855485

下载地址:http://file.locoy.com/sdk/locoyposter.7z

标签: 浏览器 sdk

评论(0) 引用(0) 浏览(1071)

Powered by emlog