Javascript:字符的编码转换和实体转换 -问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

Javascript:字符的编码转换和实体转换

2016-06-14 13:44:39 2738 1

这个问题源于此贴。http://segmentfault.com/q/10100000001...,源于@Sunny 三楼回答的“干扰串“http://www.awflasher.com/jsmail。在这里贴出实际工作的源码:

function htmlEncode( s )
{
var result = "";
for (var j = 0; j < s.length; j++ ) {

// Encode 25% of characters
if (Math.random() < 0.25 || s.charAt(j) == ':' || s.charAt(j) == '@' || s.charAt(j) == '.') {
  var charCode = s.charCodeAt(j);
  result += "&#";
  result += charCode;
  result += ";";
} else {
  result += s.charAt(j);
}

}
return result;
}

function urlEncode( s )
{
var HEX = "0123456789ABCDEF";
var encoded = "";
for (var i = 0; i < s.length; i++ ) {

// Encode 25% of characters
if (Math.random() < 0.25) {
  var charCode = s.charCodeAt(i);
  encoded += "%";
  encoded += HEX.charAt((charCode >> 4) & 0xF);
  encoded += HEX.charAt(charCode & 0xF);
} else {
  encoded += s.charAt(i);
}

} // for
return encoded;
}

function Obfuscate()
{
var plaintext = document.TheForm.F1.value;
var result = "";
result += htmlEncode(plaintext) ;
result += "
";
document.TheForm.F2.value = result;
if (document.all) {

document.all.RESULT.innerHTML = "最终效果: " + result;

} else {

document.getElementById("result").innerHTML = "最终效果: " + result + " (注意观察状态栏,这可是标准的mailto链接哦)";

}
return false; / Privacy note: returning false prevents the browser from posting your email address! /
}

我对源码的理解是,htmlEncode将本来在网页中显示的正常字符转变为html实体;urlEncode则将原来页面中href属性中的url编码为utf8格式,相当于使用了encodeURI,但是这里不使用encodeURI的原因是作者希望能够只将大约25%的字符串转义,从而加大破译者的难度。
我的问题是:
1.代码中使用了html实体其中一种表示方式其中X为的unicode编码。而通过方法atCharCode可以获得某个字符的unicode编码。问题是,当我查阅到表一(见下)时发现似乎空格是一个例外,通过atCharCode获得的值是32,而它的html实体是 ,请问这是什么原因?
2.urlEncode将unicode转化为utf8的方式让我觉得奇怪。http://cattail2012.wordpress.com/2012...。该文章是我对于字符集和编码的认识,其中一小节(相关应用)中介绍了对于unicode到utf8的转换。不知道是我错了还是作者代码存在缺陷?

screenshot

取消 提交回答
全部回答(1)
  • 杨冬芳
    2019-07-17 19:37:22

    第一个问题:&nbsp和空格在unicode里是2个不同的字符。空格的编码是32,Non-breaking space的编码是160。在HTML文本里,如果遇到多个连续的空格字符,浏览器会把它们合并成一个空格字符,而对于多个连续的&nbsp就不做合并。

    第二个问题:作者写urlEncode这个函数的目的是用来编码email地址的,而email地址只可能是ASCII字符集里的字符,UTF-8里对ASCII字符的编码规则与ASCII字符集是一样的,所以可以使用这种方式来编码。显然,用这种方式去编码超出ASCII字符集之外的字符,例如中文,是不行的。你的理解没错,作者这样写也没错,关键是看打算用在什么地方。

    0 0
相关问答

11

回答

在阿里云上安装和运行Node.js全功略

ycwong 2013-09-18 15:17:30 64396浏览量 回答数 11

19

回答

【分享】如何提高网站的打开速度?

enj0y 2012-11-17 14:35:22 56990浏览量 回答数 19

145

回答

【新手入门】云服务器linux使用手册

fanyue88888 2012-11-26 17:14:18 157678浏览量 回答数 145

28

回答

钉钉开放平台“常见问题常见问题常见问题“重要请关注

竹梅 2015-12-03 00:39:14 93760浏览量 回答数 28

22

回答

爬虫数据管理【问答合集】

我是管理员 2018-08-10 16:37:41 147228浏览量 回答数 22

31

回答

[@倚贤][¥20]刚学完html/css/js的新手学习servlet、jsp需要注意哪些问题?

弗洛伊德6 2018-10-27 21:52:43 146034浏览量 回答数 31

23

回答

【云服务器分享】网站访问速度快才是硬道理

dreamdoo 2012-10-15 10:15:02 85360浏览量 回答数 23

249

回答

阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本

云代维 2014-02-14 15:26:06 305619浏览量 回答数 249

13

回答

【云服务器分享】如何节省网站流量

dreamdoo 2012-10-15 10:36:09 80456浏览量 回答数 13

14

回答

对象存储oss【问答合集】

我是管理员 2018-08-03 14:54:02 67715浏览量 回答数 14
+关注
杨冬芳
IT从业
1
文章
9167
问答
问答排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载