关于v7.6版本提示“本地验证失败”的解决办法

作者:小文 发布于:2012-12-8 9:54 Saturday 分类:常见问题

当极个别用户升级到7.6版本后,发现会出现这个一个提示,从而导致无法以商业版用户启动火车采集器

点击查看原图

出现该问题可能是您本地的授权文件错误引起,请删除Configration目录下的Licence_74cc.dll文件,然后重新登录采集器并注册即可。

标签: WMI

评论(1) 引用(0) 浏览(4305)

V7,V8版机器码查看工具

作者:小文 发布于:2012-11-29 14:03 Thursday 分类:其它资源

为了方便客户在更换电脑里查看机器码,请下载该文件放在v7版本中主程序目录下运行,即可以看到自己的机器码。

标签: 机器码

评论(2) 引用(0) 浏览(8383)

新浪爱问共享资料下载插件

作者:小文 发布于:2012-11-22 17:10 Thursday 分类:免费插件

该插件可以下载0积分的资料。演示如图。需要注意的是,火车采集器要更新到2012.11.22号的版本,不更新会出错,更新地址http://board.locoy.com/?post=95。更新完了后再导入这个规则。

点击查看原图

标签: 新浪

评论(0) 引用(0) 浏览(8609)

火车头数据采集平台二次开发SDK

作者:小文 发布于:2012-11-9 14:36 Friday 分类:官方公告

部分企业级用户咨询如何使用我们火车采集器的一些功能进行二次开发,我们提供了强大的开发SDK(火车头采集框架测试源代码.rar)。简介如下:

开发框架主要提供无限级采集模块。用户可以通过它,快速生成具有强大采集能力的采集软件。该框架包含以下功能

1.Http请求模块
a.请求下载一个网页或文件
b.提交数据到网站
c.解析源码中的图片链接
d.探测文件真实地址
2.文件下载模块
类似火车采集器运行时显示文件下载及进度的类库,可以在界面上显示,也可以不显示界面运行.
3.无限级采集功能
类似火车采集器中的无限级采集模块中的功能。标签编辑部分支持通过采集得到数据和自定义格式的数据。提取数据的方式包含前后截取,正则提取和标签组合。数据处理部分的功能如下
a.内容截取
b.纯正则替换
c.随机插入
d.HTML标签排除
e.字符串替换
f.运行C#代码
g.字符编/解码
h.智能提取时间
i.Http头信息提取
j.Http请求
k.简繁转换
l.内容添加前后缀
m.空内容缺省
n.补全单网址
o.提取第一张图片
p.将结果转化为火星文
q.自动转化为拼音
r.自动摘要

下面我来演示一下如何使用极少量的代码,来实现一个简单的采集程序。该SDK可以免费测试使用,如需要购买技术支持请联系tech@locoy.com进行咨询。

 

点击查看原图

如图,该API调用火车采集器的无限级采集设置窗口,进行任务的配置。同时可以将所有的配置保存下来。对于编辑好的任务,可以直接点击运行任务就可以运行。而这一切,只需要少量的代码就可以实现。附件中有该程序的源代码。

 

以下是sdk的文档截图

点击查看原图

标签: APi 二次开发

评论(2) 引用(0) 浏览(16868)

火车采集器v7新浪博客文章发布模块(适合v7.7以前V7版本)

作者:小文 发布于:2012-10-18 19:33 Thursday 分类:免费插件

利用该发布模块,可以将采集来的数据发到新浪博客上去。使用方法也极其简单。(V8版本的该模块请查看 http://board.locoy.com/?post=172)

1.以单个用户来发文章

在设置发布配置时,选择使用数据包登录方式,然后填写用户名和密码即可。发布模块会自动去登录新浪并保持登陆状态。注意,发布时,时间间隔要长,一般建议3分钟以上,否则很快被封号的。单用户列表可以刷新列表。

 

2.用多个用户轮流发帖

在发布模块中,添加一个标签,标签名blog_Login,标签的内容为用户名密码,格式为一个用户名和密码,用户名和密码间以"|"分开,q多个用户名密码间以","分隔。这样模块就会使用多个帐号去发文章,注意,同样不能发的太多,帐号一般也以设置4到5个为宜。多用户只能使用默认的分类。

 

3,新浪发布要求要在1分钟以后才能发布第二篇,所以,会有1分半钟的等待时间

4,请使用一个线程去发布,多线程极易导致发布失败或帐号被封。

 

标签: 新浪

评论(15) 引用(0) 浏览(14143)

Powered by emlog