校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 網站建設 > 建站知識 > 織夢dedecms采集中用到的一些過濾規則

織夢dedecms采集中用到的一些過濾規則

POST TIME:2017-11-13 01:04

dedecms的過濾規則寫起來不是很難,規則如下:

代碼示例:
{dede:trim}要過濾的內容{/dede:trim}


如果要過濾的內容很簡單,完全可以把過濾規則直接寫在“{dede:trim}”和“{/dede:trim}”之間。
對于比較復雜的情況,請考慮使用正則,你懂的,正則表達式,那是相當強勁的。

以下是一些過濾規則的例子,供大家參考。

1、采集中去除內容里的超鏈接:

代碼示例:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}


假如要將所有超鏈接內容都去除,規則是:

代碼示例:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}


這兩個規則的不同通過下面代碼來解釋
例如文章代碼中包含著如下內容:
<a href="#">超鏈接</a>
通過第一個規則,采集結果是:超鏈接

2、過濾廣告
對于廣告來說,過濾規則就得針對html中看到的內容使用規則了,例如某些廣告僅僅是引用某個JS文件,例如

代碼示例:
<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>


這樣的規則只需

代碼示例:
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}


如果某些廣告的內容是JS代碼寫在<script></script>區間里的,例如GG的廣告,那么過濾規則應該是:

代碼示例:
{dede:trim}<script>(.*)</script>{/dede:trim}

3、一些測試過的過濾規則

代碼示例:

{dede:trim}<!–(.*)–>{/dede:trim}
{dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim}
{dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim}
{dede:trim}<select([^>]*)>{/dede:trim}
{dede:trim}</select>{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}

//by www.jbxue.com//
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim} // 內容來自www.jbxue.com//
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<script>(.*)</script>{/dede:trim}
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim} // 本文



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 晋江市| 留坝县| 岳普湖县| 班戈县| 阿拉善盟| 阿合奇县| 太和县| 浑源县| 夏津县| 苏尼特右旗| 江津市| 灵璧县| 瑞昌市| 休宁县| 通江县| 甘洛县| 阿克| 西乌| 隆昌县| 大连市| 陈巴尔虎旗| 铁岭市| 曲松县| 宝坻区| 右玉县| 宝鸡市| 双鸭山市| 南雄市| 北票市| 龙井市| 彰化市| 花垣县| 新昌县| 芜湖县| 台州市| 沙田区| 望都县| 禄丰县| 施甸县| 青川县| 喀喇沁旗|