火车采集器官方博客
赶集网电话号码识别
post by:小文 2012-10-8 11:32

赶集网目前不需要使用ocr识别,因为wap版的电话号码不是图片的。http://wap.ganji.com 。如果您不从手机版抓取数据,可以在采集器中设置多页来获取手机号码。如下

 

原地址:http://bj.ganji.com/fang1/343210963x.htm
多页地址:http://wap.ganji.com/bj/fang1/343210963x

评论:
小文
2013-10-15 10:47 回复
@lonlie:不是文字的
lonlie
2013-10-14 19:55 回复
但是58的触屏版是文字的,http://i.wap.58.com/sz/zpshangwumaoyi/149860
感谢。。。 哈哈
唐山自闭症
2013-01-29 20:27 回复
后东西,但是现在不能用了。
庆云在线
2012-11-02 13:49 回复
这个很实用 已经更换了
58的手机站还是图片多 咳
天津保安公司
2012-10-19 13:11 回复
可以好好识别下哈
lei
2012-10-12 12:35 回复
赶集有的栏目是图片的,怎么识别呢
单人操作镜头
2012-10-11 14:31 回复
都是这样的习惯就好了
天津电动卷帘
2012-10-08 15:09 回复
表示好像看不懂哈哈
发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容