采集网页数据生成自定义EXCEL表格有多简单?
作者:dong 发布于:2018-3-16 17:49 Friday
如何采集网页数据生成自定义EXCEL表格?

当然是用火车浏览器啦!!!
营销人员常需要获取行业最新信息,进而处理成自定义表格,使用火车浏览器可实现采集信息到生成自定义表格一步到位。
可视化自动提取数据,可自动定时更新的超强功能设计,确保能让您及时掌握行业最新数据。
小采妹
本期分享采集安居客合肥地区最新二手房网页数据自动生成EXCEL表格为例。
1
步骤1:打开火车浏览器→右击→点击浏览器→打开网页→输入网址并保存
右击测试运行,可以在软件页面看到打开的网页的页面
2
步骤2:取出每个房源中需要的信息右击→元素操作→单次提取→保存
(提取信息,需要写XPATH提取规则,HTTP://BBS.LOCOYPOSTER.COM/FORUM.PHP?MOD=VIEWTHREAD&TID=541&HIGHLIGHT=XPATH)
保存信息到LIST变量,然后测试提取,结果如图:
3
步骤3:对采集的信息进行处理 右击→元素操作→循环
4
步骤4:对单个源码进行处理 让数据保存到相应的变量 右击→变量处理→变量处理
先对源码进行处理保存到楼盘名这个变量
(1)先打开变量管理→单个源码进行分析
如下图所示:
需要的信息在<SPAN TITLE="和”> 源码之间.
所以写内容截取,设置如下图:
点击确定→点击保存→测试
得到需要信息;(之后其他几个变量,处理过程原理相同。)
最终得到每个需要的信息:
5
步骤5:把采集的信息保存到表格中
需要创建一个数据库文件
如图设置:
(2)写一个查询数据库语句 (目的:为了以后更新数据)
(3)通过变量比较,来判断是否入库右击→逻辑运算→变量比较→保存。
若是则不插入数据,不是则插入数据到创建的数据库中.
这样上个页面就采集完成,接下来采集下一页
步骤六:右击→文件操作→导出EXCEL
右击→元素操作→点击→保存
整个流程如图:
采集后部分数据如图:
好了以上就是今天的所有教程,技术小哥哥小姐姐你们学会了吗?不会的可要收藏一下方便以后回看哦。小采会继续推出一系列教程,让大家更了解我们火车家族的使用方法呢!
PS:免费版脚本只能运行30分钟,无法使用项目管理器,需官方提供技术支持,如需IP代理,脚本定制,公众号里咨询小采或点击下方原文咨询客服。
标签: 火车采集器;
联系我们
联系电话
-
0551-62864156
QQ邮件订阅
最新评论
- industrialegy
<a href="http://www.... - inve
这个采集到的视频地址 应该不是真实地址... - 云南桥架厂
我能说这个妹不错么 - 密密麻麻
win10 64位,处理后会留下原压缩包... - 平行进口车
以前经常用火车,来支持一下。 - 天津网站建设
文章采集器,厉害了 - 骗子医院
这个可以试试! - qq昵称
这么好的帖子,必须顶起来!! - 哈尔滨舒家网
试用一下,看是否能用。希望能用。火车头业... - 誉非
这个下载下来是安装程序,不是视频教程啊。
发表评论: