wordpress CMS主题 微信
Home > wordpress火车头采集 > 怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

高时银博客 wordpress火车头采集 点击: 2,549 次 0 0

前文我们介绍了火车头采集器如何创建分组,接下来我们就要通过火车头采集器给分组创建任务,只有创建了任务,我们才能去执行任务。比方说,我准备通过火车头采集器向我的博客“高时银博客”发表文章,该怎么做?首先,我们要找到货源——我们要采集的网站。在选择采集网时,如果想让网站对百度友好,尽量选择原创度比较高的网站,而且最好这个网站的文章内容在百度没有收录或者收录不好的,是文章内容哦,不是文章url哦。呵呵,话题扯远了,比方说,我要采集卢松松博客的文章,怎样创建这样一个任务——采集卢松松博客文章并发布。那就跟着高时银博客往下看吧。

wordpress发布模块登录版 地址:http://wanlimm.com/77201505103691.html

wordpress发布模块免登录 地址:http://wanlimm.com/77201506044245.html

第一步、在上一节创建好的分组名点击左键——>再点击右键——>创建任务(如下图):

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

也可以“主窗口——>在分组名称上点击左键——>点击顶部菜单”任务“——>创建任务(如下图):

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

第二步、点击”新建任务“后,会弹出”新建任务“窗口,在任务名处填写这个任务的名称,名称随便你填写,但是为了区别这个分组中的其它任务(因为你可以会采集几个网站),名称可以定一个让你轻易能区分的,比如我要采集卢松松博客的”好友分享“分类的文章,我就给这个任务取名为”好友分享-卢松松博客”。

第三步、添加“采集网址规则”。

我们采集的是卢松松博客的好友分享分类,这个分类有好多分页,这时我们可以采集这单一个页面的文章,也可以几个分类的文章都采集。因为默认第一页在地址栏不显示”1“的(如下图1),所以我们要点击到分页的第二页,这时可以看到分页数”2“(如下图2)。

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

 

把上图2的地址复制好,然后,”新建任务”窗口的“第一步:采集网址规则”的“起始网址”处,点击“添加”(如下图):

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

1、采集单个页面:这时会弹出“添加开始采集地址”窗口,如果只想采集一个页面的文章,就只需点击“单条网址”,在文本区域添加你刚复制的网址,然后点击“添加”,这个网址就会添加到下面的文本区域,再点击“完成”,如下图所示:

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

 

在“新建任务”窗口就会添加上这个网址(如下图)

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

2、采集多个分页:如果想采集这个“好友分享”分类连续几个分页的文章,可以在”添加开始采集地址”窗口点击“批量/多页”,如下图,把刚才复制的网址复制到“地址格式”处,然后选择这个地址中的数字“ 2”,点击后台的通配符合(*),且星号*替换这个2字(如下图)。然后,点击“添加”,在下面的文本域中就会出现“采集地址”。

怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

上图中“等差数列”,“首项”就是第一页,“项数”就是采集几页,“公差”就是前后2个分页数相减的差,如这里我采集5页,是1、2、3、4、5页,2-1=1,所以公差为1,如果你要隔1页采集一下,如:采集1、3、5、7、9页,这是公差就是2 。好了,今天就讲到这里。

 

 


文章作者:高时银博客
本文地址:http://wanlimm.com/77201504253216.html
版权所有 © 转载时必须以链接形式注明作者和原始出处!

目前还没有评论。赶快来坐沙发吧。

发表评论