[参数][参数1][参数N]要如何使用?

- 作者:火车采集器官网 ——来源:火车采集器官网 ——

我们在使用火车采集器从列表页采集内容页时,一般情况下我们设置好采集区域后,选择自动获取链接地址后,添加好过滤条件即可正常获取到内容页地址。但是有时候自动获取链接地址异常,不能使用这个功能时,我们就需要使用手动获取链接地址功能。[参数]就是在手动获取链接地址时需要使用的标签。它本身是火车采集器中的标记标签,用来匹配某些待提取的信息。这里和(*)区分开来,(*)是通配符号,用来代表某些应被忽略的信息。

[参数]出现在内容网址获取和内容标签的正则提取中,如图:

关于[参数]、[参数1]、[参数N]?这三者之间是什么样的存在?比如:http://www.dianping.com/hefei/food

如果hefei和food都是我们需要提取利用的内容,那么在写提取规则的时候我们就把它们标记为参数标签:http://www.dianping.com/[参数]/[参数]

而在拼接地址的时候就是对上面提取的参数进行利用,在这里我们提取到的参数已经进行了排序,所以hefei和food就分别为是我们提取到的[参数1]和[参数2]。但在写拼接地址的时候,我们会发现旁边出现的标签是[参数N]而不是[参数1]、[参数2],这是为什么呢?

其实[参数N]的作用是我们点击一次时就自动出现[参数1]、再点击就依次出现[参数2]、[参数3]……方便需要利用多个参数的情况。

 

 

如果参数出现的需要和要拼接的地址不同,我们可以手动修改拼接的顺序来调整参数的位置,只要链接地址拼接正确即可,顺序可以根据地址格式来自我调整。下面奉上大众点评中用参数拼接地址的真实操作案例:

 

 

进入商家列表页面后我们需要获取商家的地址,点击一个商家看看地址的格式。

 

 

回到列表页,查看页面源代码,可以发现商家的地址是不全的,因此我们需要借用源代码中的信息拼接出一个完整的内容页地址。这时源代码中的内容页地址信息就可以借助参数提取出来,不多说,看下图规则。

注意看这里的参数1,就是我们在点击参数N时出现,内容地址拼接完成之后,我们点击测试来测试一下采集到的地址是否正确。

 

如果你还有其它疑问可以来本站搜索相关问题,这里会有你想要的答案:火车脚本网

还有什么疑问可以提出来
  • 全部评论(0
    还没有评论,快来抢沙发吧!