2012年3月插件,接口开发计划

作者:小文 发布于:2012-3-21 14:53 Wednesday 分类:开发计划

1. ShopEx图片上传模块(带插件)  http://board.locoy.com/?post=100

2.5d6d网站的Web发布模块(带插件)

3.Destoon 3.0 发布接口

标签: shopex 5d6d destoon

评论(0) 引用(0) 浏览(3930)

火车采集器2011版本简介

作者:小文 发布于:2011-8-29 11:36 Monday 分类:开发计划

该文件以图文方式简单介绍了火车采集器2011。

评论(9) 引用(0) 浏览(3909)

火车采集器相关辅助工具的开发

作者:小文 发布于:2011-3-2 9:20 Wednesday 分类:开发计划

1.采集的数据最后导出文件时的文件命名规则可以设置。

评论(0) 引用(0) 浏览(4044)

火车头网页正文提取演示程序

作者:火车头 发布于:2010-12-21 17:40 Tuesday 分类:开发计划

信息抽取技术是一种广泛运用于互联网的数据挖掘技术。其目的是从互联网海量数据中抽取有意义、有价值的数据和信息,从而能更好的利用互联网资源。

正文提取就是将网页中的正文部分抽取出来。合肥乐维信息技术公司根据此前的技术积累,做成此演示程序供大家测试。希望大家积极提供宝贵的测试意见,以便我们应用到在正进行的站群软件开发中,服务广大站长。

该演示程序支持 任意网页(当然最好是内容正文页),自动识别编码,支持中英文等内容主体识别,经简单测试,正确率在90%以上,欢迎大家试用。

点击查看原图

该功能的测试请下载V8版本火车采集器,在高级菜单的“正文提取测试”中测试该功能。

标签: 正文提取 网页正文提取 text extract

评论(15) 引用(0) 浏览(11312)

论坛数据采集专家1.0beta build 20101125 发布

作者:小文 发布于:2010-11-25 23:16 Thursday 分类:开发计划

该软件专门针对论坛类采集.目前可以完成数据采集和文件下载功能,

点击查看原图

软件的具体功能请见手册.目前还在测试期.

下载地址:http://board.locoy.com/bbscopier.7z

评论(2) 引用(0) 浏览(4388)

Powered by emlog