开发者社区> 老朱教授> 正文

关于VC++ 字符集

简介:
+关注继续查看

VC程序的国际化不像JAVA,.NET那样支持的极其自然,各种各样的宏及数据类型,常使程序输出莫名其妙乱码,特别是在使用第三方类库时。

 

下面就我对VC项目字符集问题的一点心得:

1、std::string

它存储的字符取决于当前系统编码,即ANSI编码。例如,对于中文Windows XP/7 等系统,实际的系统编码为936=GB2312.

因此,std:: string  str(“中国”);内存的中的表达即为:D6 D0 B9 FA

此时,不论源文件是什么编码,也不论项目设置中的字符集如何设置,VC++ IDE在读取文件后,自动将读取的字符串转换成ANSI码流存储。这也是为什么上面的字符串输出到控制不会乱码的原因。

image

2、std:: wstring

wstring的实际含义与项目设置(即编译器决定)有关。wstring表示宽字符串。对于宽字符,即wchar_t,是用2个byte表达一个字符。wstring即wchar_t的字符串。而wchar_t表示的是什么字符,与项目设置的字符集有关系。

  • 当项目设置字符集使用Unicode字符集时,wstring存储Unicode-16字符;
  • 当项目设置字符集使用多字节字符集时,wstring使用ANSI字符集(若要编写跨平台代码,不推荐这么应用);

wstring wstr1(L"中国"); 
wstring wstr2(_T("中国"));

上述字符串都是表示字符串【中国】,是完全一样的。当项目字符集时Unicode时,其内存表达都是2D 4E FD 56.

3、Unicode16==>UTF8

出于通用性及兼容性和性能要求,程序往往需要支持UTF-8.因此程序中需要使用Unicode16==>UTF-8编码转换。而大多数成熟的第三方类库,对UTF-8支持的是比较好的。在windows下编程,可以考虑将项目字符集设置为Unicode,OS层API调用使用Unicode API,调用第三方类库时,将Unicode16转换成UTF-8编码后再执行调用。

另外,出于跨平台和性能方面的考虑,对于log操作,尽可能使用英文。


本文转自海天一鸥博客园博客,原文链接:http://www.cnblogs.com/sgsoft/archive/2011/05/02/2034626.html,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
VC++中多字节字符集和Unicode之间的互换
在Visual C++.NET中,默认的字符集是Unicode,这和Windows默认的字符集是一致的,不过在老的VC6.0等工程中,默认的字符集形式是多字节字符集(MBCS:Multi-Byte Character Set),这样导致在VC6.0中非常简单实用的各类字符操作和函数在VS2005环境下运行时会报各种各样的错误,这里总结了在Visual C++.NET2005环境中Unicode字符集下CString和char *之间相互转换的几种方法,其实也就是Unicode字符集与MBCS字符集转换。
1091 0
【C/C++】ASCII字符集
编程时经常要使用ASCII字符集,所以专门放在这里,以便日后查看: 当然,如果不能上网,也可以通过计算机来查询ASCII字符集: 方法一:C语言实现,代码如下: #include void main() { for(int ...
830 0
C++ STL学习之【vector的使用】
vector 是表示可变大小数组的序列 容器,其使用的是一块 连续 的空间,因为是动态增长的数组,所以 vector 在空间不够时会扩容;vector 优点之一是支持 下标的随机访问,缺点也很明显,头插或中部插入效率很低,这和我们之前学过的 顺序表 性质很像,不过在结构设计上,两者是截然不同的
32 0
C++ STL学习之【string类的模拟实现】
string 本质上就是一个专注于存储字符的顺序表,使用起来很方便;但在模拟实现 string 时,有许多值得注意的点,下面就来看看 string 类是如何诞生的吧
52 0
C++ STL 学习之【string】
STL 是 C++ 的重要组成部分,由六大部分构成:伪函数、空间配置器、算法、容器、迭代器 和 配接器,其中各种各样的 容器 可以很好的辅助我们写程序,比如今天要介绍的 string,有了它之后,我们对字符串的操作就能变得行云流水
45 0
【查找算法】解析学习四大常用的计算机查找算法 | C++
在数据处理的过程中,能否在最短时间内去找到目的数据,是编程开发人员非常值得关心的一个问题。所谓查找,也被称为搜索,它是指从数据文件中找出满足某些条件的记录。在数据结构中描述算法时习惯用“查找”,而在搜索引擎中找信息或资料时习惯用“搜索”。我们在电话簿中查找某人的电话号码,电话簿就像是数据文件库,而姓名就是去查找电话号码的键值。我们经常使用的搜索引擎所设计的Spider程序(网页抓取程序爬虫)会主动经由网站上的超链接“爬行”到另一个网站,搜集每个网站上的信息并且收录到数据库中,这其中就涉及到了今天要讲的查找算法。
23 0
【奇妙的数据结构世界】用图像和代码对堆栈的使用进行透彻学习 | C++
简单来说,数据结构是一种辅助程序设计并且进行优化的方法论,它不仅讨论数据的存储与处理的方法,同时也考虑到了数据彼此之间的关系与运算,从而极大程度的提高程序执行的效率,减少对内存空间的占用等。不同种类的数据结构适用于不同的程序应用,选择合适正确的数据结构,可以让算法发挥出更大的性能,给设计的程序带来更高效率的算法。
21 0
【奇妙的数据结构世界】用图像和代码对队列的使用进行透彻学习 | C++
简单来说,数据结构是一种辅助程序设计并且进行优化的方法论,它不仅讨论数据的存储与处理的方法,同时也考虑到了数据彼此之间的关系与运算,从而极大程度的提高程序执行的效率,减少对内存空间的占用等。不同种类的数据结构适用于不同的程序应用,选择合适正确的数据结构,可以让算法发挥出更大的性能,给设计的程序带来更高效率的算法。
28 0
C++学习——前进(三)
C++学习——前进(三)
17 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
继承与功能组合
立即下载
对象的生命期管理
立即下载
移动与复制
立即下载