【教程】途牛网采集规则分享

作者:dong 发布于:2018-9-19 11:39 Wednesday

进入9月

想旅行的心一直在躁动

中秋小长假和国庆黄金周

终于要来啦!

timg.gif 

中秋节是团圆的日子

虽然假期不长

但是带着一家老小散散心

别提有多幸福了

今天我们就来带大家看一下

如何采集途牛旅行网中秋旅行有关活动前十名的数据信息

微信图片_20180919110634.gif


首先,打开需要采集的页面:

http://s.tuniu.com/search_complex/whole-nj-0-%E4%B8%AD%E7%A7%8B/,因为我们只需要采集前十条热门旅游景点,所以不需要再分析下一页,直接将地址放在采集器起始地址中即可,然后在网页源码中分析内容页地址的前后源码:

1.png 


测试采集列表页地址结果:

2.png 


接下来就是具体分析内容页中需要采集的标签,下面以价格为例,分析下价格的前后字符:

3.png

分析前后字符后填入火车采集器如下:

4.png 


其他标签一样的方式分析,不再截图叙述,内容标签采集结果如下:

5.png


此次需注意:

1. 因为我们只采集前10条,因此可定义最大采集数为10,这样我们就得到了全部数据信息。

6.png

“我曾经跨过山和大海,也穿过人山人海,最后还是遗失在人潮里”,这恐怕是国庆假期出行年年的写照

中秋国庆双节即将来临

介绍完中秋国庆值得去的目的地

小采温馨提醒各位采友

中秋国庆出去旅行,一定要注意安全哦!

附件下载:
途牛.rar 164.29KB

发表评论:

Powered by emlog