火车浏览器开发SDK下载

作者:小文 发布于:2017-2-24 10:50 Friday 分类:软件培训

该SDK包含了sdk二次开发,自定义界面开发,插件开发多个文档。讨论QQ群:149855485

下载地址:http://qiniu.locoy.com/sdk/locoyposter.7z

标签: 浏览器 sdk

评论(1) 引用(0) 浏览(12091)

火车头数据采集平台Web发布模块插件的开发文档

作者:小文 发布于:2013-3-21 10:50 Thursday 分类:软件培训

v7版本在web发布时也添加了一个新的插件功能。该插件功能可以让用户自由的设置如何发布,从而可以发内容到各种各样的网站上去。用户在开发时,需要实现采集器System目录下的AppInterFace.dll文件中的IWebPost接口(在实际开发中,不能直接引用System\AppInterFace.dll文件。要引用Extensions\LocoySpider\Develop\Releas\中的没有加密的AppInterFace.dll,开发完成后,将除过AppInterFace.dll外的其它的用户自己使用的类库放在采集器目录下,插件导入模块中即可),然后在发布模块中,添加该插件即可。

点击查看原图

需要注意的一点是,SetModule方法中的参数暂时不对用户开放的。

 

using System;
using System.Collections.Generic;
using System.Text;

namespace LeWell.Api
{
    /// <summary>
    /// web在线发布接口
    /// </summary>
    public interface IWebPost:ICloneable,IDisposable
    {
        /// <summary>
        /// 设置模块的信息,方便插件使用
        /// </summary>
        /// <param name="moudle"></param>
        /// <param name="table"></param>
        void SetModule(object moudle, object table);

        /// <summary>
        /// bool方法出错后的提示信息
        /// </summary>
        string Error { get; }

        /// <summary>
        /// 是否启用登陆网站
        /// </summary>
        bool UseLogin { get; }

        /// <summary>
        /// 登陆网站
        /// </summary>
        /// <param name="loginUrl">登陆地址</param>
        /// <param name="loginRefer">来源页面</param>
        /// <param name="user_agent">user-agent</param>
        /// <param name="loginImgUrl">验证码地址</param>
        /// <param name="dicPost">登陆post数据</param>
        /// <param name="failInfos">失败信息,可能为null</param>
        /// <param name="sucessInfos">成功信息,可能为null</param>
        /// <param name="errorHtml">登陆失败后的html信息</param>
        /// <param name="cookies">登陆成功后返回的cookie</param>
        /// <returns>是否成功登陆</returns>
        bool Login(string loginUrl, string loginRefer,string user_agent, string loginImgUrl, Dictionary<string, string> dicPost, string[] failInfos, string[] sucessInfos, ref string errorHtml,System.Net.CookieCollection cookies);

        /// <summary>
        /// 是否启用获取列表
        /// </summary>
        bool UseGetList { get; }
        /// <summary>
        /// 刷新列表
        /// </summary>
        /// <param name="refreshUrl">刷新列表页面</param>
        /// <param name="refreshRefer">来源页面</param>
        /// <param name="user_agent">user-agent</param>
        /// <param name="cookies">访问需要的cookie</param>
        /// <param name="refreshStart">页面开始区域</param>
        /// <param name="refreshEnd">页面区域结束</param>
        /// <param name="refreshRegex">分类列表名称及id格式</param>
        /// <param name="html">返回的html代码</param>
        /// <returns>字典,为分类id,分类名称</returns>
        Dictionary<string, string> GetList(string refreshUrl, string refreshRefer, string user_agent, System.Net.CookieCollection cookies, string refreshStart, string refreshEnd, string refreshRegex, ref string html);

        /// <summary>
        /// 是否启用获取随机值,这个对所有的都有用
        /// </summary>
        bool UseGetFormHash { get; }

        /// <summary>
        /// 获取随机值
        /// </summary>
        /// <param name="hashUrl">随机值获取页面</param>
        /// <param name="hashRefer">来源</param>
        /// <param name="user_agent">user-agent</param>
        /// <param name="cookies">网站cookie</param>
        /// <param name="hashStart">随机值前字符串</param>
        /// <param name="hashEnd">随机值后字符串</param>
        /// <param name="result"></param>
        /// <returns>成功否</returns>
        bool GetFormHash(string hashUrl, string hashRefer, string user_agent, System.Net.CookieCollection cookies, string hashStart, string hashEnd,ref string result);

        /// <summary>
        /// 是否启用发布数据
        /// </summary>
        bool UsePost { get; }

        /// <summary>
        /// 发布文章
        /// </summary>
        /// <param name="PostUrl">发表地址</param>
        /// <param name="PostRefer">来源页</param>
        /// <param name="user_agent">user-agent</param>
        /// <param name="cookies">cookie</param>
        /// <param name="dic">发布的字典值</param>
        /// <param name="uploadFiles">上传文件信息</param>
        /// <param name="failInfos">失败标识码</param>
        /// <param name="sucessInfos">成功标识码</param>
        /// <param name="error">出错信息,因为可能是几个线程同时发的,所以不用单个实例的出错信息</param>
        /// <param name="sucess">成功标识码</param>
        /// <param name="html">返回的html代码</param>
        /// <returns>是否发布成功</returns>
        bool Post(string PostUrl, string PostRefer, string user_agent, System.Net.CookieCollection cookies, List<KeyValuePair<string, string>> dic, Dictionary<string, List<string>> uploadFiles, string[] failInfos, string[] sucessInfos, ref string error,ref string sucess,ref string html);
    }
}

标签: 开发.web发布

评论(1) 引用(0) 浏览(8729)

采集器中同义词替换功能的使用

作者:小文 发布于:2012-12-12 9:40 Wednesday 分类:软件培训

火车采集器中提供了内容替换和同义词替换两种替换方式,用来处理单个少理的替换和批量的替换。其中,同义词替换不仅是做同义词的替换,还可以做其它的替换。比如

我 们采集的某个标签是 省份 ,实际上我们采集到的是比如 陕西省,安徽省 这样的中文,但我们要发布或是导入数据库时,是要使用省份对应的id,比如陕西省的对应的是 12,安徽对应的是26,则我们可以在标签中通过同义词替换批量替换成数字,然后我们在发布时,使用该数字即可。

 

阅读全文>>

标签: 同义词替换

评论(2) 引用(0) 浏览(8887)

一团网火车采集器团购培训相关事项

作者:火车头 发布于:2012-8-10 16:52 Friday 分类:软件培训

1、  本次在线培训主要针对近期一团网组织的团购用户开设,共计六次,安排在813(周一)815(周三)817(周五)、820(周一)各一次,818日(周六)两次。普通用户也可以积极参加。

2、  具体时间点是:周一、周三 、周五的晚19:30开始,周六上午10点开始 下午15:00开始

3、  培训的时间长度根据培训人员授课的内容来决定

4、  本次培训以远程桌面,在线语音及及时的文字沟通方式在线展示给用户,用户需在培训开始前从本页面下载客户端软件(附件将在8月13日中午前后放出,请大家注意下载),下载解压后,运行"培训客户端.exe",登陆软件 按照软件的提示来操作。

5、  培训人员在培训时,注意观看远程桌面,先不要用语音工具提问,有问题可以用文字聊天工具提问,在培训人员结束培训后,客户有什么问题可以积极的提出。

培训内容请查看全文。。。

阅读全文>>

评论(5) 引用(0) 浏览(16262)

v7版PHP插件培训视频教程

作者:小文 发布于:2012-3-29 10:58 Thursday 分类:软件培训

v7版本的PHP插件和2010的插件是一样的。还是只处理列表页,内容页,多页的网页源代码,保存时的标签。

在该教程中用一个简单的例子对所有可用到插件的地方进行了演示。

在压缩包中包含了所有教程中使用到的文件。需要注意的一点是,用户使用的采集器版本需要是3.27及以后的版本。如果您的版本低于这个时间,请下载最新手动更新包更新。更新地址 http://board.locoy.com/?post=95 .注意,请先更新,再导入规则进行测试。

标签: php插件

评论(1) 引用(0) 浏览(12559)

Powered by emlog