火车采集器v7版新浪评论采集插件
作者:小文 发布于:2012-5-15 20:41 Tuesday 分类:免费插件
这个插件是对多页中的第一个页面进行了分析,获取到分页总数,然后生成了分页让采集器下载,涉及的代码为
public List<string> GetPagesUrl(int level, string pageurl, string html, string pagesStyle, string pagesCombine){
List<string> urls = new List<string>();
//"show": 127}, http://comment5.news.sina.com.cn/page/info?format=js&jsvar=pagedata&channel=gn&newsid=1-1-24331859&group=0&page=1&list=all&sort=0,
http://news.sina.com.cn/c/2012-04-26/061224331859.shtml
if (level == 1 && pageurl.Contains("page=1&"))
{
string sign="show\": ";
int pos = html.IndexOf(sign);
if (pos > 0)
{
int pos2 = html.IndexOf("}", pos);
if (pos2 > 0)
{
int count = int.Parse(html.Substring(pos + sign.Length, pos2 - pos - sign.Length));
count = (int)Math.Ceiling((double)count / 20);
for (int i = 2; i < count + 1; i++)
{
urls.Add(pageurl.Replace("page=1", "page=" + i.ToString()));
}
}
}
}
return urls;
}
public bool UseGetPagesUrl
{
get { return true; }
}
规则请在附件中下载
附件下载:
新浪评论.7z 4.19KB
标签: 新浪
评论:
联系我们
联系电话
-
0551-62864156
QQ邮件订阅
最新评论
- industrialegy
<a href="http://www.... - inve
这个采集到的视频地址 应该不是真实地址... - 云南桥架厂
我能说这个妹不错么 - 密密麻麻
win10 64位,处理后会留下原压缩包... - 平行进口车
以前经常用火车,来支持一下。 - 天津网站建设
文章采集器,厉害了 - 骗子医院
这个可以试试! - qq昵称
这么好的帖子,必须顶起来!! - 哈尔滨舒家网
试用一下,看是否能用。希望能用。火车头业... - 誉非
这个下载下来是安装程序,不是视频教程啊。
2012-06-25 02:42