用火车头好多年了,共享下自己做多个网站程序的接口

- 阅1348

本......

多页采集是否可以实现unicode转码功能?

- 阅143

今天站长在论坛看到这样一个求助的帖子,想要实现火车采集器多页采集器实现unicode转码,然后通过请求转码后的地址采集到相关的内容。下面先介绍一下问题的需求详情,然后再说一下该功能的实现方法和操作步骤。希望可以帮助到这位求助者。......

实用功能批量任务编辑让你快速建站?

- 阅190

这是由于采集器的功能限制所导致,主要原因是:网站栏目有很多,而一个数据源所编写的规则,发布的时候对应一个栏目。这样每个栏目最少都需要一个规则。如果采集的是同一个网站的数据源,规则需要写的会比较多。往往这种情况我们直接使用复制规则。但是如果有规......

火车采集器V9插件开发手册

- 阅103

火车采集器V9版本使用C#语言.Net Framework4.0开发,支持C#,PHP,Python三种类型的插件。各种插件的运行原理和开发方式不同,以下是各插件的原理以及开发方式:......

火车采集器规则预警如何设置?

- 阅96

在采集规则预警功能出来之前,我们想要处理和检查规则异常时,只能一个规则一个规则去看。如果规则很多的话,需要的时间会很长,带来了很大的不便。因此官方在采集器9.4.3.0619以后的版本中,增加了采集预警的功能。功能的界面可以参看下图,可以在这里按照自己的需......

采集完文章发布时提示:dede_htmlspecialchars后台参数提示201

- 阅183

如果使用火车采集器采集完文章之后,在织梦后台发布文章的时候提示DEDECMS Call to undefined function dede_htmlspecialchars()***101错误,当你以为是系统参数的问题,想要去系统参数设置那里设置时,又提示你Fatal error: Call to undefined function make_hash() in /dede/sys_info.php on line 201,你可能就郁......

火车采集器7.6版规则如何升级到最新版?

- 阅174

可能很多朋友都因为费用问题用的是火车采集器7.6破解版,在这里站长还是建议有条件的用户尽量使用正版的软件,毕竟新版的功能比旧版的多了很多,而且使用起来也更加安全。那么如果你从旧版换到新版之后,旧版的规则要如何才可以升级到新版呢,这里就给你说下操作......

火车采集器随机插入字符如何实现?

- 阅196

我们在使用火车采集器采集完数据后,从优化的角度来说可能会需要插入一些词来达到优化的目的,那么如何在标签中插入随机字符呢。实现起来也比较简单,下面就举例来说明如何操作来实现这个功能?需求:标题中插入随机字符实现:新建三个标签字段:原标题,随机字符......

提取标签的方法之正则表达式提取?

- 阅65

火车采集器提取字段的方法有好3种,可以使用字段截取,正则表达式,Xpath提取,Json提取4种方式,不同的方式在不同的时候使用才可以最大的提升采集效率。下面就先讲讲如何使用正则表达式提取字段。以这个网址为例:http://www.haimashop.com/thread-28060-1-1.html 采集 标题、正文。......

[参数][参数1][参数N]要如何使用?

- 阅148

我们在使用火车采集器从列表页采集内容页时,一般情况下我们设置好采集区域后,选择自动获取链接地址后,添加好过滤条件即可正常获取到内容页地址。但是有时候自动获取链接地址异常,不能使用这个功能时,我们就需要使用手动获取链接地址功能。[参数]就是在手动获......

几种常见采集器问题的解决方法?

- 阅178

由于网站页面比较复杂,使用采集器的用户也很多,因此我们可能会遇到各种各样的问题。那么遇到问题之后要怎么解决,很多人可能并不是很了解。这里总结了一些常见的问题,比如:发布word换行符号异常,设置标签不重复后链接没保存,采集器自动更新提示,百度文库文......

如何使用独立标签和列表页标签?

- 阅50

火车采集器V9有了新的功能,功能就是独立标签和列表页标签的功能。采集数据时,如果列表页有一个字段需要分配到每一篇详情页时我们可......