wordpress CMS主题 微信
Home > wordpress火车头采集 > 怎样火车头采集和发布文章:正则提取怎么用?

怎样火车头采集和发布文章:正则提取怎么用?

高时银博客 wordpress火车头采集 点击: 4,257 次 0 0

在wordpress用采集别站文章时,标题和内容都是很好采集到的,但是,wordpress有一个特别的选项——标签,这是很外来网站所没有的,因为在网站的很多网站的文章没有标签这个项,那怎么办呢?怎样才能给自己的wordpress网站的采集来的文章添加标签呢?我们可以用标题来做标签,但是不好的地方是很多标题很长。这时我们可以用被采集的文章中的图片“alt”或者对方文章比较强调的链接(当然要文章中的链接不多,否则就太多了),采集这类标签通常用到火车头采集器的“正则提取”方法,下面,就来看看怎样提取这些关键词。

下面是采集文章中的一段源码:

<p>你也是减肥一族吗?你的减肥的方法是否健康正确呢?不要为了好身材而选择不利于身体健康的方法,健康减肥才是重要的,今天呢小编就为大家介绍减肥注意事项,你需要留意哦。</p>
<p><a href="http://www.hotzuti.com/kuaisu/1227.html" title="健康减肥小妙招">健康减肥</a>注意事项1、站立重心在一只腿上:</p>

如上文中,我们想提取链接中的“健康减肥”,我们就可以用下面这样的正则式来提取(如下图):

怎样火车头采集和发布文章:正则提取怎么用?

<a href="http://www.hotzuti.com/kuaisu/(*).html" title="(*)">[参数]</a>

这里为什么不把握http://www.edtqy.com/kuaisu/1227.html 这句地址直接替换成 (*) 呢?这是因为在文章页面里可能还有链接,为了区别其它链接,所以没有这样做。[参数]就是我们所要提取的关键词。

组合结果:[参数1] [参数2] 这里的参数1、2是按正规内容里的参数顺序排列的,中间可加其它的东东,比如加上 [参数1] 减肥方法 [参数2] 。


文章作者:高时银博客
本文地址:http://wanlimm.com/77201504203155.html
版权所有 © 转载时必须以链接形式注明作者和原始出处!

目前还没有评论。赶快来坐沙发吧。

发表评论