v7版计划任务增加cron表达式测试工具

作者:小文 发布于:2012-7-20 10:34 Friday 分类:功能介绍

v7版本的计划任务基于cron表达式。因此,某些设置可能会无法直接达到,如每间隔120分钟无法在分钟里设置,可以设置成每间隔两小时。不能设置每间隔25个小时,可以设置每间隔一天。等等。下次更新中,计划任务将增加最近的几次运行时间,方便用户查看。以下附件就是基于此的小工具。

点击查看原图

标签: cron

评论(1) 引用(0) 浏览(8500)

火车采集器v7版新浪评论采集插件

作者:小文 发布于:2012-5-15 20:41 Tuesday 分类:免费插件

这个插件是对多页中的第一个页面进行了分析,获取到分页总数,然后生成了分页让采集器下载,涉及的代码为

        public List<string> GetPagesUrl(int level, string pageurl, string html, string pagesStyle, string pagesCombine)
        {
            List<string> urls = new List<string>();
            //"show": 127}, http://comment5.news.sina.com.cn/page/info?format=js&jsvar=pagedata&channel=gn&newsid=1-1-24331859&group=0&page=1&list=all&sort=0

http://news.sina.com.cn/c/2012-04-26/061224331859.shtml


            if (level == 1 && pageurl.Contains("page=1&"))
            {
              string sign="show\": ";
              int pos = html.IndexOf(sign);
              if (pos > 0)
              {
                  int pos2 = html.IndexOf("}", pos);
                  if (pos2 > 0)
                  {
                      int count = int.Parse(html.Substring(pos + sign.Length, pos2 - pos - sign.Length));
                      count = (int)Math.Ceiling((double)count / 20);
                      for (int i = 2; i < count + 1; i++)
                      {
                          urls.Add(pageurl.Replace("page=1", "page=" + i.ToString()));
                      }
                  }
              }
            }
            return urls;
        }

 

  public bool UseGetPagesUrl
        {
            get { return true; }
        }

 

规则请在附件中下载

 点击查看原图点击查看原图

标签: 新浪

评论(1) 引用(0) 浏览(8841)

火车采集器V7,V8版WordPress 3.3 版本Web发布模块(带发布插件)

作者:小文 发布于:2012-4-23 16:00 Monday 分类:其它资源

wordpress的发布一直是比较头疼的事情,因为它的数据库结构复杂,加之升级也较快,旧的接口文件难以达到和它发布一样的效果。v7版本增加了发布时使用插件,这个可以方便我们自己写发布的流程。该发布模块的使用方法如下,请一定仔细看:

 

1.如果您需要填写自定义字段,请在内容发布参数中添加一个表单项。比如,您定义的字段名为 download,则您需要添加的格式如下,表单名格式为 meta[自定义字段名] 。如果要添加多个自定义字段,再添加即可。

点击查看原图

2.如果您需要上传缩略图,请建一个标签名为thumb,这个标签中要有图片下载的。该发布模块会将图片上传并设置为缩略图

3.该发布模块是使用原英文wordpress系统做的,成功标识码在实际使用中可能要进行修改。

标签: wordpress

评论(22) 引用(0) 浏览(39451)

火车采集器V7版MySql,SqlServer索引添加工具

作者:小文 发布于:2012-4-21 11:00 Saturday 分类:其它资源

如果您使用的火车采集器是2012.4.21号或以后的版本,则该工具对您没有用处,不必下载使用。如果您是先前使用myql或是sqlserver做本地保存数据库,在数据量大的情况下,加载数据缓慢,就应用该工具对原来的数据表中的已采,已发添加索引。

该工具下载完后请放在火车采集器目录下运行。

标签: 索引

评论(0) 引用(0) 浏览(17903)

火车采集器V7版各版本间升级办法

作者:小文 发布于:2012-4-10 16:57 Tuesday 分类:常见问题

1.从免费版升级到商业版

先将免费版升级到最新的文件版本,然后下载最新的商业版本,将商业版本中的主程序 LocoyPlatform.exe 复制出来,覆盖到免费版中即可。注意,只需要复制这个文件。最后,打开主程序,输入用户名密码,登录即可以使用商业版本。升级后如果运行任务出现找不到网址库的问题,请检查文件 Extensions\LocoySpider\Database.xml ,修改其中的 <DatabaseType>Sqlite</DatabaseType> 为 <DatabaseType>Access</DatabaseType> 。

 

2.从商业版升级到更高级的商业版本

什么也不需要做。如果采集器在升级前后一直是运行的,需要重启一下采集器。

标签: 升级

评论(0) 引用(0) 浏览(6636)

Powered by emlog