• wordpress CMS主题:ssmay主题 wordpress CMS主题:ssmay主题
  • 首页 > wordpress火车头采集 > 怎样火车头采集和发布文章:正则提取怎么用?

    怎样火车头采集和发布文章:正则提取怎么用?

    作者: 分类:wordpress火车头采集 点击: 8,211 次
    wordpress CMS主题:ssmay主题

      扫描下面的二维码,“关注”我的百家号。

      在wordpress用采集别站文章时,标题和内容都是很好采集到的,但是,wordpress有一个特别的选项——标签,这是很外来网站所没有的,因为在网站的很多网站的文章没有标签这个项,那怎么办呢?怎样才能给自己的wordpress网站的采集来的文章添加标签呢?我们可以用标题来做标签,但是不好的地方是很多标题很长。这时我们可以用被采集的文章中的图片“alt”或者对方文章比较强调的链接(当然要文章中的链接不多,否则就太多了),采集这类标签通常用到火车头采集器的“正则提取”方法,下面,就来看看怎样提取这些关键词。

      下面是采集文章中的一段源码:

      <p>你也是减肥一族吗?你的减肥的方法是否健康正确呢?不要为了好身材而选择不利于身体健康的方法,健康减肥才是重要的,今天呢小编就为大家介绍减肥注意事项,你需要留意哦。</p>
      <p><a href="http://www.hotzuti.com/kuaisu/1227.html" title="健康减肥小妙招">健康减肥</a>注意事项1、站立重心在一只腿上:</p>

      如上文中,我们想提取链接中的“健康减肥”,我们就可以用下面这样的正则式来提取(如下图):

      怎样火车头采集和发布文章:正则提取怎么用?

      <a href="http://www.hotzuti.com/kuaisu/(*).html" title="(*)">[参数]</a>

      这里为什么不把握http://www.edtqy.com/kuaisu/1227.html 这句地址直接替换成 (*) 呢?这是因为在文章页面里可能还有链接,为了区别其它链接,所以没有这样做。[参数]就是我们所要提取的关键词。

      组合结果:[参数1] [参数2] 这里的参数1、2是按正规内容里的参数顺序排列的,中间可加其它的东东,比如加上 [参数1] 减肥方法 [参数2] 。



      欢迎“关注”我的百家号。

      头条二维码
      加入我的QQ群
      头条二维码
      关注我的百家号

    文章作者:码不停蹄
    本文地址:http://wanlimm.com/77201504203155.html
    版权所有 © 转载时必须以链接形式注明作者和原始出处!

    上一篇:
    下一篇:
    wordpress CMS主题:ssmay主题

    或许你会感兴趣的文章:

    发表评论

    电子邮件地址不会被公开。 必填项已用*标注

    This site uses Akismet to reduce spam. Learn how your comment data is processed.