• wordpress CMS主题:ssmay主题wordpress CMS主题:ssmay主题
  • 首页 > wordpress火车头采集 > 怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

    怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

    作者: 分类:wordpress火车头采集 点击: 4,001 次
    wordpress CMS主题:ssmay主题

      前文我们介绍了火车头采集器如何创建分组,接下来我们就要通过火车头采集器给分组创建任务,只有创建了任务,我们才能去执行任务。比方说,我准备通过火车头采集器向我的博客“高时银博客”发表文章,该怎么做?首先,我们要找到货源——我们要采集的网站。在选择采集网时,如果想让网站对百度友好,尽量选择原创度比较高的网站,而且最好这个网站的文章内容在百度没有收录或者收录不好的,是文章内容哦,不是文章url哦。呵呵,话题扯远了,比方说,我要采集卢松松博客的文章,怎样创建这样一个任务——采集卢松松博客文章并发布。那就跟着高时银博客往下看吧。

      wordpress发布模块登录版 地址:http://wanlimm.com/77201505103691.html

      wordpress发布模块免登录 地址:http://wanlimm.com/77201506044245.html

      第一步、在上一节创建好的分组名点击左键——>再点击右键——>创建任务(如下图):

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

      也可以“主窗口——>在分组名称上点击左键——>点击顶部菜单”任务“——>创建任务(如下图):

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

      第二步、点击”新建任务“后,会弹出”新建任务“窗口,在任务名处填写这个任务的名称,名称随便你填写,但是为了区别这个分组中的其它任务(因为你可以会采集几个网站),名称可以定一个让你轻易能区分的,比如我要采集卢松松博客的”好友分享“分类的文章,我就给这个任务取名为”好友分享-卢松松博客”。

      第三步、添加“采集网址规则”。

      我们采集的是卢松松博客的好友分享分类,这个分类有好多分页,这时我们可以采集这单一个页面的文章,也可以几个分类的文章都采集。因为默认第一页在地址栏不显示”1“的(如下图1),所以我们要点击到分页的第二页,这时可以看到分页数”2“(如下图2)。

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

       

      把上图2的地址复制好,然后,”新建任务”窗口的“第一步:采集网址规则”的“起始网址”处,点击“添加”(如下图):

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

      1、采集单个页面:这时会弹出“添加开始采集地址”窗口,如果只想采集一个页面的文章,就只需点击“单条网址”,在文本区域添加你刚复制的网址,然后点击“添加”,这个网址就会添加到下面的文本区域,再点击“完成”,如下图所示:

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

       

      在“新建任务”窗口就会添加上这个网址(如下图)

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

      2、采集多个分页:如果想采集这个“好友分享”分类连续几个分页的文章,可以在”添加开始采集地址”窗口点击“批量/多页”,如下图,把刚才复制的网址复制到“地址格式”处,然后选择这个地址中的数字“ 2”,点击后台的通配符合(*),且星号*替换这个2字(如下图)。然后,点击“添加”,在下面的文本域中就会出现“采集地址”。

      怎样火车头采集和发布文章(3):创建任务之采集网址规则(一)

      上图中“等差数列”,“首项”就是第一页,“项数”就是采集几页,“公差”就是前后2个分页数相减的差,如这里我采集5页,是1、2、3、4、5页,2-1=1,所以公差为1,如果你要隔1页采集一下,如:采集1、3、5、7、9页,这是公差就是2 。好了,今天就讲到这里。

       

       



      QQ二维码

    文章作者:高时银博客
    本文地址:http://wanlimm.com/77201504253216.html
    版权所有 © 转载时必须以链接形式注明作者和原始出处!

    上一篇:
    下一篇:
    wordpress CMS主题:ssmay主题

    或许你会感兴趣的文章:

    发表评论

    电子邮件地址不会被公开。 必填项已用*标注

    This site uses Akismet to reduce spam. Learn how your comment data is processed.