使用火车头采集器采集新闻【图文】教程实例

- 作者:zhanhy ——来源:原创 ——

使用火车头采集器采集新闻【图文】教程实例,这里主要通过实例来讲解一下火车头采集器怎么使用的问题,通过采集新闻,来用图文做为本次的教程载体。希望通过这篇文章可以让你对火车采集器怎么使用有一个清晰的认识?

第一步:找到火车采集器的安装目录,双击LocoySpider.exe打开程序后输入账号和密码进入程序主界面。

使用火车头采集器采集新闻【图文】教程实例

第二步:在菜单栏点击新建任务,然后把起始网址填写好,如果要采集多页但是不会设置的话,可以参考这篇文章:火车头采集器起始网址怎么进入多行编辑模式,一般可能都用不到这个功能,直接设置翻页即可,如果不能设置翻页再使用这个功能。之后设置好区域和链接过滤,即可自动采集到内容也链接地址。


使用火车头采集器采集新闻【图文】教程实例

第三步:配置要采集的内容页链接地址中的标题,摘要,正文,关键词和图片。这里主要说下关键词和摘要的提取,提取这两个字段时为了SEO考虑,尽量不要采集对方网站的数据,使用火车头采集器自带的规则,使用已有标签组合,选择使用[标签:正文]后,在数据处理中添加对应的规则即可。关键词的数据处理规则是:自动分词,摘要的数据处理规则是:自动摘要,提取前128个字符即可。

源码如下:

<h1>宋茜出席全球时尚大秀活动 踏上惊喜旅程共赴天才世界</h1>    
		<div class="artInfo"><a target="_blank" href=" rel="noflow" >http://www.yule.com.cn</a> <div id="author" style="display:none">sw</div>     
		2021-09-26 08:50:13&nbsp;&nbsp;&nbsp;来源:<a href='http://www.yule.com.cn' rel="noflow"  target='_blank' style='color:#AAA'>中国娱乐网</a>&nbsp;&nbsp;&nbsp;    
		</div>    
			<div style="width:600px;margin:5px auto; padding:0px auto;"><script type="text/javascript" src=" rel="noflow" ></script></div>    
			<div id="NewsContentLabel" class="NewsContent">    
								<p>  <strong>中国娱乐网讯www.yule.com.cn </strong>9月25日,宋茜受邀出席时装全球大秀,身为品牌大使的宋茜身穿曜黑亮皮羽绒服现身现场,反季潮流展现出现代摩登意味。all black造型化身异次元神秘女郎,携手品牌为全球观众奉上一场精彩绝伦的线上时装大秀。</p>    
<div style="text-align: center"><img src=" rel="noflow"  /></div>    
<div style="text-align: center"><img src="http://news.yule.com.cn/uploadfile/2021/0926/20210926085048933.jpg" rel="noflow"/></div>    
<div style="text-align: center"><img src="http://news.yule.com.cn/uploadfile/2021/0926/20210926085049436.jpg" rel="noflow"/></div>    
<p>  本次大秀穿梭于纽约、米兰、上海、东京和首尔之间,跨越艺术、电影、音乐、极限运动等诸多精彩领域,各种想法交汇碰撞,多元世界聚合成一,迸发出前所未有的创造力。宋茜与Alicia Keys现场连线开启关于灵感的对话,进一步探索与深入品牌核心与本色。同样一直以来宋茜都是一个善于思考、充满创造力的人,这也使她在演员这条道路上最大限度地调动起自己的主动性和艺术创造性,塑造出一个个鲜活的角色。天才世界全球大秀弥补了线下和线上世界之间的距离,令创意和娱乐在聚光灯下大放光彩,也让所有人看到了属于宋茜的无限可能。</p>    
<p style="text-align: center"><img src="  rel="noflow" /></p>    
<p style="text-align: center"><img src=" rel="noflow"  /></p>    
<p style="text-align: center"><img src="http://news.yule.com.cn/uploadfile/2021/0926/20210926085050944.jpg" rel="noflow"/></p>

image.png


写完以上内容之后,一个简单的采集规则基本完成了,下面就要配置自动发布规则了,由于之前已经讲过,这里不再多少。感兴趣的可以去看看这篇文章:火车头采集器免登陆发布模块怎么制作


如果你还有其它疑问可以来本站搜索相关问题,这里会有你想要的答案:火车脚本网

如果你还有其它疑问可以来本站搜索相关问题,这里会有你想要的答案:火车脚本网

还有什么疑问可以提出来
  • 全部评论(0