关于VC++ 字符集

简介:

VC程序的国际化不像JAVA,.NET那样支持的极其自然,各种各样的宏及数据类型,常使程序输出莫名其妙乱码,特别是在使用第三方类库时。

 

下面就我对VC项目字符集问题的一点心得:

1、std::string

它存储的字符取决于当前系统编码,即ANSI编码。例如,对于中文Windows XP/7 等系统,实际的系统编码为936=GB2312.

因此,std:: string  str(“中国”);内存的中的表达即为:D6 D0 B9 FA

此时,不论源文件是什么编码,也不论项目设置中的字符集如何设置,VC++ IDE在读取文件后,自动将读取的字符串转换成ANSI码流存储。这也是为什么上面的字符串输出到控制不会乱码的原因。

image

2、std:: wstring

wstring的实际含义与项目设置(即编译器决定)有关。wstring表示宽字符串。对于宽字符,即wchar_t,是用2个byte表达一个字符。wstring即wchar_t的字符串。而wchar_t表示的是什么字符,与项目设置的字符集有关系。

  • 当项目设置字符集使用Unicode字符集时,wstring存储Unicode-16字符;
  • 当项目设置字符集使用多字节字符集时,wstring使用ANSI字符集(若要编写跨平台代码,不推荐这么应用);

wstring wstr1(L"中国"); 
wstring wstr2(_T("中国"));

上述字符串都是表示字符串【中国】,是完全一样的。当项目字符集时Unicode时,其内存表达都是2D 4E FD 56.

3、Unicode16==>UTF8

出于通用性及兼容性和性能要求,程序往往需要支持UTF-8.因此程序中需要使用Unicode16==>UTF-8编码转换。而大多数成熟的第三方类库,对UTF-8支持的是比较好的。在windows下编程,可以考虑将项目字符集设置为Unicode,OS层API调用使用Unicode API,调用第三方类库时,将Unicode16转换成UTF-8编码后再执行调用。

另外,出于跨平台和性能方面的考虑,对于log操作,尽可能使用英文。


本文转自海天一鸥博客园博客,原文链接:http://www.cnblogs.com/sgsoft/archive/2011/05/02/2034626.html,如需转载请自行联系原作者

相关文章
|
API Windows
VC++中多字节字符集和Unicode之间的互换
在Visual C++.NET中,默认的字符集是Unicode,这和Windows默认的字符集是一致的,不过在老的VC6.0等工程中,默认的字符集形式是多字节字符集(MBCS:Multi-Byte Character Set),这样导致在VC6.0中非常简单实用的各类字符操作和函数在VS2005环境下运行时会报各种各样的错误,这里总结了在Visual C++.NET2005环境中Unicode字符集下CString和char *之间相互转换的几种方法,其实也就是Unicode字符集与MBCS字符集转换。
1393 0
|
C++ C语言
【C/C++】ASCII字符集
编程时经常要使用ASCII字符集,所以专门放在这里,以便日后查看: 当然,如果不能上网,也可以通过计算机来查询ASCII字符集: 方法一:C语言实现,代码如下: #include void main() { for(int ...
970 0
|
8月前
|
编译器 C++ 开发者
【C++篇】深度解析类与对象(下)
在上一篇博客中,我们学习了C++的基础类与对象概念,包括类的定义、对象的使用和构造函数的作用。在这一篇,我们将深入探讨C++类的一些重要特性,如构造函数的高级用法、类型转换、static成员、友元、内部类、匿名对象,以及对象拷贝优化等。这些内容可以帮助你更好地理解和应用面向对象编程的核心理念,提升代码的健壮性、灵活性和可维护性。
|
4月前
|
人工智能 机器人 编译器
c++模板初阶----函数模板与类模板
class 类模板名private://类内成员声明class Apublic:A(T val):a(val){}private:T a;return 0;运行结果:注意:类模板中的成员函数若是放在类外定义时,需要加模板参数列表。return 0;
95 0
|
4月前
|
存储 编译器 程序员
c++的类(附含explicit关键字,友元,内部类)
本文介绍了C++中类的核心概念与用法,涵盖封装、继承、多态三大特性。重点讲解了类的定义(`class`与`struct`)、访问限定符(`private`、`public`、`protected`)、类的作用域及成员函数的声明与定义分离。同时深入探讨了类的大小计算、`this`指针、默认成员函数(构造函数、析构函数、拷贝构造、赋值重载)以及运算符重载等内容。 文章还详细分析了`explicit`关键字的作用、静态成员(变量与函数)、友元(友元函数与友元类)的概念及其使用场景,并简要介绍了内部类的特性。
173 0
|
6月前
|
编译器 C++ 容器
【c++11】c++11新特性(上)(列表初始化、右值引用和移动语义、类的新默认成员函数、lambda表达式)
C++11为C++带来了革命性变化,引入了列表初始化、右值引用、移动语义、类的新默认成员函数和lambda表达式等特性。列表初始化统一了对象初始化方式,initializer_list简化了容器多元素初始化;右值引用和移动语义优化了资源管理,减少拷贝开销;类新增移动构造和移动赋值函数提升性能;lambda表达式提供匿名函数对象,增强代码简洁性和灵活性。这些特性共同推动了现代C++编程的发展,提升了开发效率与程序性能。
185 12
|
7月前
|
设计模式 安全 C++
【C++进阶】特殊类设计 && 单例模式
通过对特殊类设计和单例模式的深入探讨,我们可以更好地设计和实现复杂的C++程序。特殊类设计提高了代码的安全性和可维护性,而单例模式则确保类的唯一实例性和全局访问性。理解并掌握这些高级设计技巧,对于提升C++编程水平至关重要。
131 16
|
8月前
|
编译器 C语言 C++
类和对象的简述(c++篇)
类和对象的简述(c++篇)
|
7月前
|
编译器 C++
类和对象(中 )C++
本文详细讲解了C++中的默认成员函数,包括构造函数、析构函数、拷贝构造函数、赋值运算符重载和取地址运算符重载等内容。重点分析了各函数的特点、使用场景及相互关系,如构造函数的主要任务是初始化对象,而非创建空间;析构函数用于清理资源;拷贝构造与赋值运算符的区别在于前者用于创建新对象,后者用于已存在的对象赋值。同时,文章还探讨了运算符重载的规则及其应用场景,并通过实例加深理解。最后强调,若类中存在资源管理,需显式定义拷贝构造和赋值运算符以避免浅拷贝问题。