火车头能否提取标题固定的文字

- 阅590

比如我采集的文章标题:我爱我的祖国,我想取出“祖国”2个字当分类id。首先这个需求是可以实现,如果词不是太多的话,可以考虑使用正则替换。把标题中不要的关键词使用正则替换掉即可实现该操作。注意这个分类ID的标签可以使用标题的值后再使用正则处理。如果分类......

火车采集器如何采集json格式数据?

- 阅573

......

火车采集器的乱序发布可以打乱更大一些吗?

- 阅4886

火车采集器的发布设置那里有乱序发布,但是乱序发布是在一定范围内随机发布文章。对于一些有特殊需求的人员,可能需要把这个范围变的更大。比如采集了1000篇文章,如何让他可以1000篇随机发布。......

源码中找不到数据内容如何采集字段

- 阅556

由于现在网页技术越来越复杂,因此在采集数据的时候也会遇到很多困难。有的网页使用了新的技术,如果直接查看页面源码的话,不能找到里面的数据。遇到这种情况我们要怎么对数据进行采集呢!......

采集结束以后如何发布到本地数据库?

- 阅4959

如果想要在采集完数据之后发布到本地数据库,就要先学会制作数据库发布模块。火车采集器可以发布的数据库类型有4种:MySql,SqlServer,Oracle,Access用户可以根据自己的需要来选择最适合自己的那种。下面就以MySql为例讲解一下数据库发布模块的制作。注意:这里的发布数据......

抖音最新采集方案,抖音分布式爬虫使用文档 2019~2020.3

- 阅4035

最近有人在问我如何采集抖音的数据,我找了几个方案,以下几个方案是可用的包括用户采集和无水印视频下载......

火车采集器可以用在哪些地方?

- 阅4879

火车采集器可以用在哪些地方呢?这个问题恐怕是所有刚接触或者准备购买采集器的人都会询问的问题,这里就简单的说明一下。如果你有以下情形之一,都可以考虑选择使用火车采集器。业务发展遭遇瓶颈?数据提取速度太慢?舆情监测无从下手?建网站苦于没内容?等等都可以......

火车采集下载图片失败后再次下载图片遇到图片不能下载?

- 阅86

火车采集器特定时候会出现图片下载成功,但是采集器识别说有图片下载失败。如果在发布文章时选择图片下载失败不发布文章,就会导致重新下载图片的文章不能正常发布,这样重新下载图片也就没有实际意义了。那么什么时候会出现这种情况,我们遇到这种情况要怎么解......

采集器最新的谷歌插件出现报错怎么解决?

- 阅1086

在2020年6月12号采集器官方人员对谷歌翻译插件进行了更新,用户可以参考下面的过程来使用。如果出现类似下图的错误,可以参考本教程来修复你遇到的问题,如果仍然不能解决,可以联系官方的客服来解决问题。对于付费用户,他们解决问题的速度还是很快。......

原时间年月日如何转换成年月日时分秒格式?

- 阅675

如果原网站的日期只有年月日那么自己网站上面的时间格式死年月日时分秒,遇到这种情况要怎么处理成自己想要的时间格式呢!......

新版的web发布配置程序数据参数多变量也很多?要如何配置?

- 阅4198

新版的wordpress发布配置程序数据参数多变量也很多?要如何配置?我想问一下这几个怎么处理:如下图所示,动态值可以添加一个随机标签用来生成随机数,之后把这个字段的值填上这个标签名即可。时间字段分开之后可以使用:年:[系统时间转化:yy]月:[系统时间转化:MM]日......

火车头如何采集表格数据,并保存成文字格式?

- 阅3319

虽然我们在采集数据时,一般都是采集文字或者段落的形式出现。这种歌情况非常容易采集和处理成我们自己想要的格式,因此非常简单和方便。但是如果我们遇到表格数据时要怎么采集呢,这里就给你介绍一下火车头采集器如何采集表格数据。希望可以帮助到你,我们来举......