正则替换 html

简介: 正则表达式,去除所有HTML标签  protected string str = "sdasasdsddsdsaaassss 说是道 ";     protected void Page_Load(object sender, EventArgs e)    {         //...

正则表达式,去除所有HTML标签

 protected string str = "<table><tr><td>sdasasdsdd</td></tr></table><br><p>sds</p><img id='img1' src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50' alt=''>aaassss<br><img src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50' alt=''> 说是道 ";

    protected void Page_Load(object sender, EventArgs e)
    {

        //string regexstr = @"<[^>]*>";    //去除所有的标签

        //@"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
        
        // string regexstr = @"<img[^>]*>";   //去除图片的正则

       // string regexstr = @"<(?!br).*?>";   //去除所有标签,只剩br

        // string regexstr = @"<table[^>]*?>.*?</table>";   //去除table里面的所有内容

        string regexstr = @"<(?!img|br|p|/p).*?>";   //去除所有标签,只剩img,br,p
  
        str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);

    }

 

 

asp中正则表达式去除HTML标记(窃自eWebEditor)
2009年12月31日 星期四 下午 12:40
function ExecReg(re, content)
    
Dim myRegExp, ResultString
    
Set myRegExp = New RegExp
     myRegExp.Global
= True
     myRegExp.Pattern
= re
     ResultString
= myRegExp.Replace(content, "" )
     ExecReg
= ResultString
end function

function DecodeFilter(html)
         html
= LCase (html)
' 去除所有客户端脚本javascipt,vbscript,jscript,js,vbs,event,
         html = ExecReg( " </?script[^>]*> " , html)
         html
= ExecReg( " (javascript|jscript|vbscript|vbs): " , html)
         html
= ExecReg( " on(mouse|exit|error|click|key) " , html)
         html
= ExecReg( " &# " , html)
' 去除表格<table><tr><td><th><a><p><img><div>
         html = ExecReg( " </?table[^>]*> " , html)
         html
= ExecReg( " </?tr[^>]*> " , html)
         html
= ExecReg( " </?th[^>]*> " , html)
         html
= ExecReg( " </?td[^>]*> " , html)
         html
= ExecReg( " </?a[^>]*> " , html)
         html
= ExecReg( " </?p[^>]*> " , html)
         html
= ExecReg( " </?img[^>]*> " , html)
         html
= ExecReg( " </?div[^>]*> " , html)
         html
= ExecReg( " </?ul[^>]*> " , html)
         html
= ExecReg( " </?li[^>]*> " , html)
         html
= ExecReg( " </?tbody[^>]*> " , html)
         html
= ExecReg( " </?h1[^>]*> " , html)
         html
= ExecReg( " </?h2[^>]*> " , html)
         html
= ExecReg( " </?h3[^>]*> " , html)
         html
= ExecReg( " </?h4[^>]*> " , html)
         html
= ExecReg( " </?h5[^>]*> " , html)
         html
= ExecReg( " </?h6[^>]*> " , html)
         html
= ExecReg( " </?b[^>]*> " , html)
         html
= ExecReg( " </?strong[^>]*> " , html)
' 去除样式类class=""
         html = ExecReg( " (<[^>]+) class=[^ |^>]*([^>]*>) " , html)
' 去除样式style=""
         html = ExecReg( " (<[^>]+) style=""[^""]*""([^>]*>) " ,   html)
' 去除XML<?xml>
         html = ExecReg( " </?xml[^>]*> " , html)
' 去除命名空间<o:p></o:p>
         html = ExecReg( " </?[a-z]+:[^>]*> " , html)
' 去除字体<font></font>
         html = ExecReg( " </?font[^>]*> " , html)
' 去除字幕<marquee></marquee>
         html = ExecReg( " </?marquee[^>]*> " , html)
' 去除对象<object><param><embed></object>
         html = ExecReg( " </?object[^>]*> " ,   html)
         html
= ExecReg( " </?param[^>]*> " , html)
         html
= ExecReg( " </?embed[^>]*> " , html)
         DecodeFilter
= html
end function



Function RemoveHTML(strText)
 Dim RegEx
 Set RegEx = New RegExp
 RegEx.Pattern = "<[^>]*>"
 RegEx.Global = True
 RemoveHTML = RegEx.Replace(strText, "")
End Function


function nohtml(str)
dim re
Set re=new RegExp
re.IgnoreCase =true
re.Global=True
re.Pattern="(/<.[^/<]*/>)"
str=re.replace(str," ")
re.Pattern="(/<//[^/<]*/>)"
str=re.replace(str," ")
str=replace(str," ","")
str=replace(str," ","")
nohtml=str
set re=nothing
end function

 

目录
打赏
0
0
0
0
5
分享
相关文章
正则 去除html标记
//string regexstr = @"]*>"; //去除所有的标签 //@"]*?>.*?" //去除所有脚本,中间部分也删除 // string regexstr = @"]*>"; //去除图片的正则 // string regexstr = @""; //去除所有标签,只剩br // string regexstr = @"]*?>.
639 0
|
23天前
|
【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
40 1
【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
【01】完成新年倒计时页面-蛇年新年快乐倒计时领取礼物放烟花html代码优雅草科技央千澈写采用html5+div+CSS+JavaScript-优雅草卓伊凡-做一条关于新年的代码分享给你们-为了C站的分拼一下子
【01】完成新年倒计时页面-蛇年新年快乐倒计时领取礼物放烟花html代码优雅草科技央千澈写采用html5+div+CSS+JavaScript-优雅草卓伊凡-做一条关于新年的代码分享给你们-为了C站的分拼一下子
138 21
【01】完成新年倒计时页面-蛇年新年快乐倒计时领取礼物放烟花html代码优雅草科技央千澈写采用html5+div+CSS+JavaScript-优雅草卓伊凡-做一条关于新年的代码分享给你们-为了C站的分拼一下子
【02】v1.0.1更新增加倒计时完成后的放烟花页面-优化播放器-优化结构目录-蛇年新年快乐倒计时领取礼物放烟花html代码优雅草科技央千澈写采用html5+div+CSS+JavaScript-优雅草卓伊凡-做一条关于新年的代码分享给你们-为了C站的分拼一下子
【02】v1.0.1更新增加倒计时完成后的放烟花页面-优化播放器-优化结构目录-蛇年新年快乐倒计时领取礼物放烟花html代码优雅草科技央千澈写采用html5+div+CSS+JavaScript-优雅草卓伊凡-做一条关于新年的代码分享给你们-为了C站的分拼一下子
61 14
【02】v1.0.1更新增加倒计时完成后的放烟花页面-优化播放器-优化结构目录-蛇年新年快乐倒计时领取礼物放烟花html代码优雅草科技央千澈写采用html5+div+CSS+JavaScript-优雅草卓伊凡-做一条关于新年的代码分享给你们-为了C站的分拼一下子
|
2月前
css3 svg制作404页面动画效果HTML源码
css3 svg制作404页面动画效果HTML源码
67 34
|
2月前
html+js+css实现的建筑方块立体数字时钟源码
html+js+css实现的建筑方块立体数字时钟源码
95 33
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等