修改DEDE采集功能之常用过滤规则

在使用织梦采集功能设置采集规则时,经常会用到过滤规则,而且织梦自带的正则在使用过程中,不是很奏效,每次点击过来总是要修改。一气之下,于是乎,把他给改了,改动后,更适合我自己使用。朋友们可以随自己喜好去改,方法如下:

找到文件:
/dede_zheshiwodemulu/templets/co_trimrule.html
晒下我改过的代码,之后再说修改应注意事项,有喜欢的可以直接复制。

修改注意事项:

  1. 我使用的是织梦5.7 UTF-8版本,源码中charset=<?php echo $cfg_soft_lang; ?>没有调用出utf-8,所以乱码,我直接写上了。
  2. 先看一段截取的代码:

    注意看他的“name=”xxx””和“id=”xxx””,刚才开始我没注意,所以结果是在后台采集功能点击确定后不能输出规则,如果自己要增加更多项时,如果总数是18条,那么第一段tr中两项td中的name和id的值要分别改为name=”font1″ id=”font1″和name=”font10″ id=”font10″,这就它的规律。别弄错就好。

另外,如果你会经常写规则,而且某些规则又是几乎每次都用,每次都要手动的输入,那么你可以这么改:

找到织梦源码的新增采集节点文件:
/dede_zheshiwodemulu/templets/co_add_step2.htm.html

把常用的规则直接写到textarea标签里,如:<textarea>[内容]</textarea>

下面是我改后的代码的一部分,过滤规则也加进去了,如下:

如果是input标签,可以加入加到value元素中,

<input name=”notename” type=”text” id=”notename” value=”【】” style=”width:250px” />

注意:

如果要加入”<”或”>”,不能直接加,要使用转义字符,如:&lt;a(.*)&gt;

这是左尖括号&lt;,这是右尖括号&gt;

好了,就到这吧,发现问题就记下来,也为自己备忘。

承接各种网站开发与修改、爬虫、数据采集分析、小程序等任务

Html+Css+JS+PHP+Nodejs+Python

专治网站各种不服

一起探讨,互相学习,共同进步!有事儿您说话。

This entry was posted in 织梦 by 织梦先生. Bookmark the permalink.