锟斤拷 (转)

简介: 锟斤拷,经常在搜索引擎和网站上看到的字符。是一种因微软漏洞造成的乱码。 Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER 那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。

锟斤拷,经常在搜索引擎和网站上看到的字符。是一种因微软漏洞造成的乱码。

Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER

那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。

如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话

一个汉字2个字节,最终的结果就是:锟斤拷

我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。
网友est专门写了一篇文章来考证问题来源:

Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。
那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,
例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。

 

http://baike.haosou.com/doc/5600962.html

 

相关文章
|
6月前
如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝(详解)
如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝(详解)
45 1
如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝(详解)
|
6月前
【多思路解决喝汽水问题】1瓶汽水1元,2个空瓶可以换一瓶汽水,给20元,可以喝多少汽水
【多思路解决喝汽水问题】1瓶汽水1元,2个空瓶可以换一瓶汽水,给20元,可以喝多少汽水
159 0
|
6月前
|
Java
小明买了一堆桃子,不知道个数,第一天吃了一半的桃子,还不过瘾,又多吃了一个。以后他每天吃剩下的桃子的一半还多一个,到n天只剩下一个桃子了。问:最开始买了多少桃子。(使用Java实现)
小明买了一堆桃子,不知道个数,第一天吃了一半的桃子,还不过瘾,又多吃了一个。以后他每天吃剩下的桃子的一半还多一个,到n天只剩下一个桃子了。问:最开始买了多少桃子。(使用Java实现)
102 0
|
算法
算法:3瓶空瓶子可以换一瓶汽水
算法:3瓶空瓶子可以换一瓶汽水
170 0
|
JSON 数据格式 Windows
这么可爱的彩虹屁老婆,真的不想“娶”一个放桌面上吗?
这么可爱的彩虹屁老婆,真的不想“娶”一个放桌面上吗?
215 0
|
人工智能
UPC-放牛奶的冰箱(二分)
UPC-放牛奶的冰箱(二分)
103 0
UPC-放牛奶的冰箱(二分)
L2-032 彩虹瓶 (25 分)(栈)
L2-032 彩虹瓶 (25 分)(栈)
133 0
L2-032 彩虹瓶 (25 分)(栈)
|
人工智能 BI
【CCCC】L3-001 凑零钱 (30分),01背包路径打印
【CCCC】L3-001 凑零钱 (30分),01背包路径打印
147 0