在C#中可以使用正则表达式来过滤html字符,比如,在验证用户输入时,为了保证安全性,就需要过滤html字符。
using System.Text.RegularExpressions;
Regex.Replace(htmlcode ,"<[^>]+>","");
解释一下:< 代表以 "< "开头
[^>] 其中[^...] 就是匹配任何字符,但不许匹配^之后紧跟的字符,也就是如果"<>" 出现在字符串中,是不会去过滤的,因为它部属于html标记.
然后就是那个 + 号, 加号的意思就是匹配前面的至少一个搜索项
最后是 >,表示html标记以>结尾。
作者:Tyler Ning
出处:http://www.cnblogs.com/tylerdonet/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,如有问题,可以通过以下邮箱地址williamningdong@gmail.com 联系我,非常感谢。