C#用正则表达式去掉Html中的script脚本和html标签

简介: 原文 C#用正则表达式去掉Html中的script脚本和html标签 ///         /// 用正则表达式去掉Html中的script脚本和html标签         ///         ///         ///         public...

原文 C#用正则表达式去掉Html中的script脚本和html标签

/// <summary>

         /// 用正则表达式去掉Html中的script脚本和html标签
         /// </summary>
         /// <param name="Htmlstring"></param>
         /// <returns></returns>
         public static string NoHTML( string Htmlstring)
         {
             //删除脚本  
             Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>" , "" , RegexOptions.IgnoreCase);
             //删除HTML  
             Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>" , "" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+" , "" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"-->" , "" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"<!--.*" , "" , RegexOptions.IgnoreCase);
 
             Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);" , "\"" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);" , "&" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);" , "<" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);" , ">" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);" , "   " , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);" , "\xa1" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);" , "\xa2" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);" , "\xa3" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);" , "\xa9" , RegexOptions.IgnoreCase);
             Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);" , "" , RegexOptions.IgnoreCase);
 
             Htmlstring.Replace( "<" , "" );
             Htmlstring.Replace( ">" , "" );
             Htmlstring.Replace( "\r\n" , "" );
             Htmlstring = HttpUtility.HtmlDecode(Htmlstring).Replace( "<br/>" , "" ).Replace( "<br>" , "" ).Trim();
 
             return Htmlstring;
         }
目录
相关文章
|
移动开发 HTML5
HTML5标签的类型
HTML5标签的类型。
321 5
|
移动开发 搜索推荐 UED
HTML5的新语义化标签
HTML5引入的这些新语义化标签,通过明确标识内容的结构和意义,使得网页结构更加清晰,易于理解和维护。使用这些标签不仅提升了网页的可读性和可访问性,还增强了搜索引擎和辅助技术对网页内容的解析能力。在实际开发中,合理使用这些语义化标签,能够显著提升网页的质量和用户体验。
527 49
C#正则表达式快速入门
C#正则表达式快速入门
133 9
|
存储 移动开发 前端开发
高效的 HTML 与 CSS 编写技巧,涵盖语义化标签、文档结构优化、CSS 预处理、模块化设计、选择器优化、CSS 变量、媒体查询等内容
本文深入探讨了高效的 HTML 与 CSS 编写技巧,涵盖语义化标签、文档结构优化、CSS 预处理、模块化设计、选择器优化、CSS 变量、媒体查询等内容,旨在提升开发效率、网站性能和用户体验。
376 5
|
JavaScript 前端开发
HTML 脚本2
&lt;noscript&gt;标签用于在浏览器禁用或不支持脚本时提供替代内容。该元素可包含所有常见的 HTML body 元素。当脚本不可用时,&lt;noscript&gt; 中的内容将被显示。例如:`&lt;noscript&gt;抱歉,你的浏览器不支持 JavaScript!&lt;/noscript&gt;`
|
JavaScript 前端开发
HTML 脚本1
JavaScript 通过 `&lt;script&gt;` 标签嵌入 HTML,增强页面的动态和交互性。它可以包含内联脚本或引用外部脚本文件,常用于图片操作、表单验证和内容动态更新。
|
JavaScript 前端开发
HTML 脚本3
本教程介绍JavaScript的基本用法,包括在HTML中直接输出文本、响应事件和处理HTML样式。示例代码展示了如何使用`document.write()`输出文本,通过点击按钮触发事件,以及利用`document.getElementById().style`修改元素样式。
|
移动开发 编解码 UED
除了 `<audio>` 和 `<video>` 标签,HTML5 还支持哪些多媒体格式?
【10月更文挑战第19天】HTML5对多种多媒体格式的支持,为网页开发者提供了丰富的选择,能够更好地满足不同类型多媒体内容在网页中的展示和交互需求,提升了网页的用户体验和多媒体应用的多样性。
|
JavaScript 前端开发
电话号码正则表达式 代码 javascript+html,JS正则表达式判断11位手机号码
电话号码正则表达式 代码 javascript+html,JS正则表达式判断11位手机号码
625 2
|
前端开发
【HTML】img标签和超链接标签
【HTML】img标签和超链接标签
266 2