火车采集器图片识别程序

作者:小文 发布于:2010-10-13 13:26 Wednesday 分类:其它资源

该工具可以配合火车采集器图片识别插件工具.该插件下载地址: http://board.locoy.com/?post=24

 

点击查看原图

 

使用方法如下:


将该工具放在和火车采集器同目录下.否则不能运行.

请先输入图片地址,然后点击下载,则可以看到如图中的远程图片.然后,点击识别,程序会自动将数字分割.每个数字下边对应的是相应的识别值.如果图片中的数字和实际的不符,请在对应的文本框内写上正确的数字,然后点击ok按钮,程序会将该特征码保存,然后请再次点击识别.如果正确,则可以进行其它操作了.如果您一不小心添加了错误的标识码,没关系,请在对应的号码上双击,就可以将其删除掉.

当所有的数字识别均正确后,可以点击保存特征码,将已识别的保存在文件中.如果需要在火车采集器中使用,则需要将上边我们提到的插件启用,同时,将导出的特征码的文件命名为 image.txt,放在火车采集器程序的同目录下即可.导出的特征码,如果下次使用,可以使用加载特征码的功能加载.

标签: 识别 图片

评论(11) 引用(0) 浏览(16276)

DEDECMS自定义模型web发布模块制作注意事项

作者:小文 发布于:2010-10-4 23:45 Monday 分类:常见问题

如果你是用了自定义模型,并且添加了自定义字段,要制作web发布模块的时候应该按照以下步骤更改原对应模块(以文章系统系统为例)

1.在post值中增加对应字段的名称和标签值。比如我自定义了一个模型,模型识别id是16,自定义了一个新字段,数据库字段名称为 xinziduan,类型为单行文本那么应该更改

channeltype=16&channelid=16

2.追加自定义字段的post代码,加入 &xinziduan=[标签:新字段]  ,并且在采集规则中采集好对应的 新字段 标签

一般朋友做到这里就结束了。结果发现还是不能用!新字段采集的内容还是不能正常发表!其实还有一个很重要的原因被忽略了。你应该再追加一句话:

&dede_addonfields=xinziduan%2Ctext%3B

这句话是用来提交你新追加字段的表单信息,你可以通过某些工具看到这句话。在默认的模型中是没有这句post值的。
另外他追加的数值中原格式是 xinziduan,text;  但是你发post值得时候应该将标点和中文decode成utf8格式的编码,才能正常使用。所以 逗号编码为%2C,分号为 %3B
这样就能保证你的内容正常使用了

这个数值中逗号前边是字段名称,后边是类型。不要写错。
你可以用抓包软件截取到post的值看看就知道了。


原作者:qcmcat  测试通过.

标签: dede

评论(2) 引用(0) 浏览(17369)

Wordpress 2.9.2,3.0.1 免登陆发布接口

作者:小文 发布于:2010-9-27 9:56 Monday 分类:免费接口

 

Wordpress2.9.2,3.0.1 免登陆文章发布接口使用说明

一、功能特性
1、免登陆,用户可以设置验证密码来防止未授权的访问.
2、多用户随机发布文章.
3、适用wordpress 2.9.2和3.0.1

二、使用教程
1、文字教程
    1.1、从火车采集器官方下载接口文件.
    1.2、打开接口文件,修改验证密码,然后保存.
    1.3、修改接口文件名并上传至网站的根目录.
    1.4、修改发布模块 Wordpress2.9.2 免登陆接口发布模块.cwr ,将发布模块里的发布文件地址后缀及刷新列表文件地址后缀中的文件名修改为您刚才修改的接口文件名.
    1.5、设置发布配置,采集并开始发布.
2、视频教程请参考:
    DedeCMS: http://video.locoy.com/jiekou/dede/dede56_article.7z
    帝国CMS: http://video.locoy.com/jiekou/ecms/ecms65_article.7z


三、注意事项
1、该接口是接口程序直接操作的数据库,目前支持写入文章及添加tag,如果您添加了某些插件,是发表文章时使用的,应不会起效.如有此种情况,您可以在发布完成后再编辑以达到效果.


四.参数说明
1、必选参数
    title             标题
    content                内容
    fid                栏目ID
    username                用户名,必须使用网站上已存在的用户名,默认是随机用户名,用户需要在模块中设置
    pw                      验证密码.在刷新列表和post发布时使用,需要模块和接口中的验证密码一致.

2、可选参数   
    post_date               发布时间,格式为 2010-01-01 12:20:10
    post_excerpt            摘要
    post_tags               tags,多个之间用,分隔

标签: wordpress

评论(42) 引用(0) 浏览(39607)

火车采集器插件功能详解

作者:小文 发布于:2010-9-24 11:29 Friday 分类:软件培训

火车采集器2010版增加了多处插件处理点,可以更方便用户的二次开发.

点击查看原图

对于各部分插件的说明及使用方法如下:

1.采网址:

该处的插件可以对1级,2级网址的采集起作用(也就是说0级网址的采集不会使用插件).插件会对火车采集器0级,1级网址请求回来的html代码进行处理,处理完的html代码交给采集器,采集器再进行网址提取和过滤.

需要注意的问题是如果您使用了2级网址采集,在插件处理0级或是1级网址所请求回来的代码时,您需要自己分析请求的网址和内容,从而知道您到底是处理0级还是1级html内容处理.

2.采内容:

该处的插件是采集器将默认页源代码下载完成后,将整个html代码交给插件处理.插件可以对html代码进行添加,删除等操作.比如默认页中有js脚本生成动态网址,您需要多页采集这个动态网址内的内容,则可以写程序生成 多页地址,然后用采集器去获取其中的地址,然后用采集器的多页功能处理.比如有些动态生成的下载地址,您可以写程序生成,然后用采集器获取并下载.

3.采多页:

该处的插件是采集器将多页代码下载完成后,将整个html代码交给插件处理.然后采集器再从处理后的代码中分析获取标签内容,下载文件等操作.

需要注意的一点是,如果有多个多页,每个多页地址采集器都会处理.对于插件如何知道自己在处理哪个多页,请根据传入的网址及内容由开发者写代码判定.

4.保存时:

该处的插件是采集器已完成标签的提取,文件的下载,然后在保存到数据库之前所做的处理.该插件传入的参数和其它三个插件不是,它是一个数组,是标签名对应标签值的组合.用户可以在这里对标签的值进行处理,比如价格的计算,单位的转化.该插件的操作位于火车采集器标签的不符合内容处理前,因此,您也可以设定标签的值为特定的值,从而实现不保存或是删除该记录的功能.如果您设置了数据库中不得有重复记录,也可以使用该插件,实现有不得重复的数据的处理.

 

一个插件可以同时包含其它的页面的代码.如可以有处理列表网址页的代码,也可以有处理保存时的代码.具体的调用请参见开发示例.

 

PHP插件及C#插件的开发非常简单,具体请参见默认的开发示例.在插件管理器中,选择新建插件,即可以看到默认的开发环境及说明.

标签: 插件

评论(3) 引用(0) 浏览(20622)

百度相关搜索随机加标题前缀

作者:小文 发布于:2010-9-21 21:50 Tuesday 分类:免费插件

该插件会采集标题的相关搜索结果,然后将相关搜索结果随机取一条加在 标题前.形成 相关搜索结果_原标题 的效果.
 

标签: 百度

评论(2) 引用(0) 浏览(9612)

Powered by emlog