新浪爱问共享资料下载插件
作者:小文 发布于:2012-11-22 17:10 Thursday 分类:免费插件
该插件可以下载0积分的资料。演示如图。需要注意的是,火车采集器要更新到2012.11.22号的版本,不更新会出错,更新地址http://board.locoy.com/?post=95。更新完了后再导入这个规则。
标签: 新浪
火车采集器v7新浪博客文章发布模块(适合v7.7以前V7版本)
作者:小文 发布于:2012-10-18 19:33 Thursday 分类:免费插件
利用该发布模块,可以将采集来的数据发到新浪博客上去。使用方法也极其简单。(V8版本的该模块请查看 http://board.locoy.com/?post=172)
1.以单个用户来发文章
在设置发布配置时,选择使用数据包登录方式,然后填写用户名和密码即可。发布模块会自动去登录新浪并保持登陆状态。注意,发布时,时间间隔要长,一般建议3分钟以上,否则很快被封号的。单用户列表可以刷新列表。
2.用多个用户轮流发帖
在发布模块中,添加一个标签,标签名blog_Login,标签的内容为用户名密码,格式为一个用户名和密码,用户名和密码间以"|"分开,q多个用户名密码间以","分隔。这样模块就会使用多个帐号去发文章,注意,同样不能发的太多,帐号一般也以设置4到5个为宜。多用户只能使用默认的分类。
3,新浪发布要求要在1分钟以后才能发布第二篇,所以,会有1分半钟的等待时间
4,请使用一个线程去发布,多线程极易导致发布失败或帐号被封。
标签: 新浪
百度文库文档下载插件(最后更新2015.3.12)
作者:乐文 发布于:2012-9-28 14:47 Friday 分类:免费插件
该插件可以下载百度文库中积分为0的文档。用户需要在登录的情况下使用。注意要填写cookie和user-agent,在登录时要进入到文库页面。最后的结果会保存在本地采集器Wenku目录下。
该插件要求采集器是8.4或以上版本支持,导入规则时,请先删除旧版插件 百度文库下载.dll
火车采集器v7版新浪评论采集插件
作者:小文 发布于:2012-5-15 20:41 Tuesday 分类:免费插件
这个插件是对多页中的第一个页面进行了分析,获取到分页总数,然后生成了分页让采集器下载,涉及的代码为
public List<string> GetPagesUrl(int level, string pageurl, string html, string pagesStyle, string pagesCombine){
List<string> urls = new List<string>();
//"show": 127}, http://comment5.news.sina.com.cn/page/info?format=js&jsvar=pagedata&channel=gn&newsid=1-1-24331859&group=0&page=1&list=all&sort=0,
http://news.sina.com.cn/c/2012-04-26/061224331859.shtml
if (level == 1 && pageurl.Contains("page=1&"))
{
string sign="show\": ";
int pos = html.IndexOf(sign);
if (pos > 0)
{
int pos2 = html.IndexOf("}", pos);
if (pos2 > 0)
{
int count = int.Parse(html.Substring(pos + sign.Length, pos2 - pos - sign.Length));
count = (int)Math.Ceiling((double)count / 20);
for (int i = 2; i < count + 1; i++)
{
urls.Add(pageurl.Replace("page=1", "page=" + i.ToString()));
}
}
}
}
return urls;
}
public bool UseGetPagesUrl
{
get { return true; }
}
规则请在附件中下载
标签: 新浪
58验证码识别(最后更新2016.5.26)
作者:小余 发布于:2012-5-15 15:23 Tuesday 分类:免费插件
请先下载 58电话识别采集规则.rar,解压后导入采集规则,然后关闭火车采集器,删除掉Plugins文件夹下的 58验证码.dll ,然后再下载另一个压缩包,解压其中的 58验证码.dll 文件到文件夹Plugins下,再打开采集器,就可以看到插件了。如果您v7版本导入成功后看不到插件,请下载最新版本再导入。现在插件是自动识别后,将结果保存在字符串<tel>电话号码</tel>中,如图,具体设置可以看示例采集规则。
有些不能识别的号码,插件是将不能识别的保存在了58_error.log文件中。如果您认为插件识别错误,请将这个文件中的记录发给我们。我们会第一时间更新该插件。
标签: 58
联系我们
联系电话
-
0551-62864156
QQ邮件订阅
最新评论
- industrialegy
<a href="http://www.... - inve
这个采集到的视频地址 应该不是真实地址... - 云南桥架厂
我能说这个妹不错么 - 密密麻麻
win10 64位,处理后会留下原压缩包... - 平行进口车
以前经常用火车,来支持一下。 - 天津网站建设
文章采集器,厉害了 - 骗子医院
这个可以试试! - qq昵称
这么好的帖子,必须顶起来!! - 哈尔滨舒家网
试用一下,看是否能用。希望能用。火车头业... - 誉非
这个下载下来是安装程序,不是视频教程啊。