小文 - 火车采集器官方博客

<?php
/*
*火车采集器外部编程接口处理标签内容示范文件
*该文件内自动系统的三个参数$LabelArray $LabelCookie,$LabelUrl
*对任意采集的标签都适用请对标签内容处理后直接将该数组serialize($LabelArray)输出，
*采集器内部即可接收到该标签的内容，对比以前的接口规则，新规则可以实现标签之间的数据调用和处理
*参数说明：
*$LabelArray    - 标签名及标签内容集合结构如：Array('栏目id' => 2,'出处'=> 'www.locoy.com','作者'=>'火车采集器','内容'=>'<center><b>暴笑短信') ##
*$LabelCookie   - 对应采集中用到的Cookie值
*$LabelUrl      - 当前采集的页面的Url地址
* 特别注意:如果是处理列表页,默认页,多页时会有以下两个标签
    $LabelArray['Html']       网页的源代码,没有经过采集器处理的,直接下载后的数据.修改这里的数据,请将新值赋予$LabelArray['Html']
    $LabelArray['PageType']   值可能为 List, Pages, Content 分别代表处理列表页,多页,默认页
* @Copyright Copyright (c) 2005-2010 http://www.locoy.com
* @Version    LocoySpider 2010 or later
* @Licence    Support On LocoySpider Standard and Enterprise Edition
*以上语句建议不更改,以下为用户操作区域该区域只限对数组值进行操作，不得有打印输出产生，不得直接增加或删除相应标签名
*/
if($LabelArray['Html'])
{
    if($LabelArray['PageType']=='List')
    {
        $urlArr=array();
        $html=$LabelArray['Html'];
        $today=date("Y-m-d",time());
        preg_match_all("/href=\"([^\"]*?\.html)\"/",$html,$mcs);
        //var_dump($mcs);
        if(count($mcs)>0)
        {
            foreach($mcs[1] as $url)
            {
                if(strpos($url,$today)>0) $urlArr[]=$url;
            }
            $LabelArray['Html']='<a href="'.implode('"><a href="',$urlArr).'">';
        }
    }
}
//#############以上为用户操作区域#############################################################################################################################
//#############以下语句必须保留，建议不更改###################################################################################################################
//ob_clean();
echo serialize($LabelArray);
?>

标签: php 插件

评论(6) 引用(0) 浏览(12538)

"XXX站点创建失败"的解决办法

作者：小文发布于：2010-9-14 14:56 Tuesday 分类：常见问题

如果默认的任务列表可以显示,创建站点或任务时出现失败的提示,很可能是由于用户使用了自定义时间,在保存数据库中时,这种时间格式不被ACCESS接入,导致失败.

处理办法:

修改时间格式为默认的 yyyy-MM-dd HH:mm:ss

注意事项:在火车采集器2010-9-15号后发布的版本不受此影响.用户不需要修改任何设置.

标签: 时间

评论(0) 引用(0) 浏览(6778)

Mysql Field * doesn't have a default value解决方法

作者：小文发布于：2010-9-13 18:06 Monday 分类：常见问题

当采集器使用mysql作为数据库时,如果mysql版本在5.0或以上,可能会出现类似 Mysql Field * doesn't have a default value的问题.这是国为 MySQL manual 上说：“Prior to MySQL 5.0.2, .............................BLOB and TEXT columns cannot be assigned a default value. ”.所以我们需要修改mysql,使之兼容.修改办法

打开my.ini，查找
sql-mode="STRICT_TRANS_TABLES,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION"

修改为

sql-mode="NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION"

然后重启MYSQL

标签: mysql

评论(0) 引用(0) 浏览(18384)

«... 26 27 28 29 30 31 32 33 34 35 36 ... »

火车采集器官方博客

发布关于火车采集器的最新消息,最新资源,最新活动

服务器提交协议冲突的解决办法

采集引起的服务器w3wp.exe占用CPU100%

PHP采网址(列表页处理)插件的开发方法

"XXX站点创建失败"的解决办法

Mysql Field * doesn't have a default value解决方法

搜索

联系我们

联系电话

QQ邮件订阅

最新评论