火车头采集器的详细使用方法和技巧。这里直接给大家贴出作者使用的这个版本的火车头,

简单说采集主要分为几个步骤进行,首先了解每个步骤的工作原理和任务目标,就能很好的熟悉这个采集器操作了。

火车头采集器采集规则,详细使用教程,实例教学

如图所示,作者圈出来的主要也就三个步骤加上最后表格保存及一些列的设置。下面就一个一个来讲。

首页就是第一步,采集网址规则,按逻辑关系来说,采集器想要采集每个网页上的内容之前是不是先要获取到这些页面的URL,获得这些网址之后采集器才能到一个个页面上去采集你想要的内容。那么问题就简单了,我们首先要获得分类页面上展示的这一个个产品链接,就要打开一个分类页的源码,然后找到这些产品代码的区域段,在区域段的上方和下方个找一个唯一性的标签,这样就能成功的截取到我们想要的这类产品的一个个链接了,有时候还要配上包含字符和不包含字符等等,(一些做了JS的网页的情况又是不一样,这个情况另行讨论),下面作者拿实例图给大家做展示说明:

火车头采集器采集规则,详细使用教程,实例教学

假设我想采集这个假发站点的human hair wigs这一类产品,我点开这个大类后看到一共分为5页,每页展示的是59件产品,我现在首先要把这5页的产品的URL作为我的目标URL,建立任务,如下图所示,

火车头采集器采集规则,详细使用教程,实例教学

目标网址建好后,就需要填写目标网址的代码筛选规则了,

隐藏内容
本内容需权限查看
  • 普通: 10金币
  • 年会员: 免费
  • 永久会员: 免费

具体细节和问题可以在网站留言部分留言讨论…

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。