采集网页数据生成自定义EXCEL表格有多简单?

作者:dong 发布于:2018-3-16 17:49 Friday

如何采集网页数据生成自定义EXCEL表格?



当然是用火车浏览器啦!!!



营销人员常需要获取行业最新信息,进而处理成自定义表格,使用火车浏览器可实现采集信息到生成自定义表格一步到位。

可视化自动提取数据,可自动定时更新的超强功能设计,确保能让您及时掌握行业最新数据。

小采妹



本期分享采集安居客合肥地区最新二手房网页数据自动生成EXCEL表格为例。



1


步骤1:打开火车浏览器→右击→点击浏览器→打开网页→输入网址并保存





  • 右击测试运行,可以在软件页面看到打开的网页的页面





2


步骤2取出每个房源中需要的信息右击→元素操作→单次提取→保存

(提取信息,需要写XPATH提取规则,HTTP://BBS.LOCOYPOSTER.COM/FORUM.PHP?MOD=VIEWTHREAD&TID=541&HIGHLIGHT=XPATH)




  • 保存信息到LIST变量,然后测试提取,结果如图:





3


步骤3:对采集的信息进行处理 右击→元素操作→循环





4


步骤4:对单个源码进行处理 让数据保存到相应的变量 右击→变量处理→变量处理



  • 先对源码进行处理保存到楼盘名这个变量


(1)先打开变量管理→单个源码进行分析




如下图所示:




  • 需要的信息在<SPAN TITLE="和”> 源码之间.

  • 所以写内容截取,设置如下图:






点击确定→点击保存→测试





  • 得到需要信息;(之后其他几个变量,处理过程原理相同。)

  • 最终得到每个需要的信息:





5


步骤5:把采集的信息保存到表格中

需要创建一个数据库文件

如图设置:




(2)写一个查询数据库语句 (目的:为了以后更新数据)





(3)通过变量比较,来判断是否入库右击→逻辑运算→变量比较→保存。





  • 若是则不插入数据,不是则插入数据到创建的数据库中.






这样上个页面就采集完成,接下来采集下一页


步骤六:右击→文件操作→导出EXCEL






  • 右击→元素操作→点击→保存






  • 整个流程如图:





  • 采集后部分数据如图:





好了以上就是今天的所有教程,技术小哥哥小姐姐你们学会了吗?不会的可要收藏一下方便以后回看哦。小采会继续推出一系列教程,让大家更了解我们火车家族的使用方法呢!



PS:免费版脚本只能运行30分钟,无法使用项目管理器,需官方提供技术支持,如需IP代理,脚本定制,公众号里咨询小采或点击下方原文咨询客服。

标签: 火车采集器;

发表评论:

Powered by emlog