官方

火车头采集器V9 内网破解版 持续更新至9.12

作者 : 官方 发布时间: 2020-02-4 102 人阅读

火车采集器我一直在用,是老牌的采集工具了。它不仅可做抓取工具,也可以做数据清洗、分析、挖掘已经可视化等工作。数据源可来源于网页,网页中能看到的内容和不可看到都可以通过自定义的采集规则进行抓取。今天给大家分享火车头采集器V9 内网破解版,后面会持续更新到9.12,现在版本是V9.8。

火车头采集器V9使用说明

1、解压在深码下载的软件压缩包,打开安装包所在文件夹,双击安装程序开始使用。

2、点击出现登录页面,我们直接点登录,进入主程序:

以上是安装使用说明,该软件在win10测试可用,软件是绿化版,打开即用,

以下介绍采集规则使用:

第一步:的设置。

1、打开软件,选择╋号,新建任务。

2、选择向导添加

3、选择批量网址

4、我要采集的网址(网址一定是有规则的网址比如慧聪网)复制到地址格式栏,选取数字点击[地址参考](千万不要少选或者多选,只选会变化的数字)后,数字变成[地址参考]。

5、在地址参数蓝,每次递增1页,共?页,这里根据自己需要抓去几页来填写,然后保存。我们选择5页来举例。

 6、保存后,起始网址栏,网址变化成这样,然后点击测试看是否能采集到网址

7、  从结果栏我们可以看出,我们选择了共采集5个网页,说明是正确。

8、首先我们随便找一个产品,比如第3页的第1个。

9、点击进去 我们只记住他的网页跳转链接的变化,比如这个/supplyself/531678453.html

10、我们再回到火车刚才测试结果里找到第3页的链接打开,子目录里找到刚才类似的网址,随便双击打开一个后,自动跳转到。

第二部:

1、跳转后此处显示网址,就是刚才你在第一步测试的结果栏,点击的网址,我们选择测试看下。

2、复制测试的链接后,粘贴到浏览器打开。

3、打开链接后,我们发现软件里的标题和网页里的标题是一样的,这说明,网页信息匹配了,可以采集了。

4、接下来,我举例采集公司名片信息。找到查看联系方式,点击进去。

5、复制公司名》打开网页源代码》Ctrl+F》Ctrl+V。找到代码位置,代码必须是</li>开头,到公司名前面符号结束,不能多也不能少。

 6、将代码复制到软件内容标签的开头字符串里,讲结尾代码复制到结尾字符串里。

然后,点击测试,你会惊奇的发现》》》成功了!!!!保存!!!

电话、联系人,步骤一样就不一一讲解了,只需在标签列表点加好添加内容就好了。

 

1. 深码博客软件源码都来源于网络采集和网络分享转贴,请不要用于商业用途,如有侵权请邮件联系站长!
2. 如果你也有好的软件或者源码,可以到个人中心投稿或者联系站长,分享有C币奖励和额外收入!
3. 深码博客提供的所有源码、软件、插件等等其他资源,都不包含技术服务请大家谅解!
4. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
深码博客 - 专业软件源码资源库 » 火车头采集器V9 内网破解版 持续更新至9.12