锟斤拷 (转)

简介: 锟斤拷,经常在搜索引擎和网站上看到的字符。是一种因微软漏洞造成的乱码。 Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER 那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。

锟斤拷,经常在搜索引擎和网站上看到的字符。是一种因微软漏洞造成的乱码。

Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER

那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。

如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话

一个汉字2个字节,最终的结果就是:锟斤拷

我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。
网友est专门写了一篇文章来考证问题来源:

Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。
那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,
例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。

 

http://baike.haosou.com/doc/5600962.html

 

相关文章
|
1月前
如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝(详解)
如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝(详解)
15 1
如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝(详解)
|
2月前
【多思路解决喝汽水问题】1瓶汽水1元,2个空瓶可以换一瓶汽水,给20元,可以喝多少汽水
【多思路解决喝汽水问题】1瓶汽水1元,2个空瓶可以换一瓶汽水,给20元,可以喝多少汽水
49 0
|
4月前
|
Java
小明买了一堆桃子,不知道个数,第一天吃了一半的桃子,还不过瘾,又多吃了一个。以后他每天吃剩下的桃子的一半还多一个,到n天只剩下一个桃子了。问:最开始买了多少桃子。(使用Java实现)
小明买了一堆桃子,不知道个数,第一天吃了一半的桃子,还不过瘾,又多吃了一个。以后他每天吃剩下的桃子的一半还多一个,到n天只剩下一个桃子了。问:最开始买了多少桃子。(使用Java实现)
|
6月前
|
算法
算法:3瓶空瓶子可以换一瓶汽水
算法:3瓶空瓶子可以换一瓶汽水
|
7月前
华为机试HJ61:放苹果
华为机试HJ61:放苹果
|
存储
【锟斤拷�⊠是怎样炼成的】——两分钟帮你彻底弄懂计算机的编码原理
【锟斤拷�⊠是怎样炼成的】——两分钟帮你彻底弄懂计算机的编码原理
142 0
Hugo 网站优化(5): 穷的还剩 8 分钱, 压缩图片,还能省省
Hugo 网站优化(5): 穷的还剩 8 分钱, 压缩图片,还能省省
170 0
Hugo 网站优化(5): 穷的还剩 8 分钱, 压缩图片,还能省省
UPC--换座位(一道没想到暴力就能过的题)
题目描述 聪聪和同学们正在玩这样一个换座位的游戏:班上共有2n个少先队员,开始时每个少先队员坐在自己的板凳上排成一队,由聪聪开始击鼓,每次击鼓开始时,前n个同学坐到第2、4、…、2n个板凳上,后n个同学坐到第1、3、…、2n-1个板凳上,击鼓结束时坐错或者还没有坐到对应板凳上的同学就要接受惩罚——表演一个节目,并按规定坐好。聪聪不断的击鼓然后停顿后又击鼓…,同学们都觉得这个游戏很好玩,但是当游戏结束时,同学们傻眼了,由于每位同学的板凳都差不多,他们找不到自己的板凳了。 而聪聪这时反应特别快,他说经过一定次数的换座位,每位同学一定能回到自己的板凳的。那么这个次数最少是多少呢?你会计算吗?
169 0
|
Windows
我要喝汽水
我要喝汽水
86 0
我要喝汽水
|
网络协议 Linux
可恶,又被小林装到了!
可恶,又被小林装到了!
可恶,又被小林装到了!