VC++中多字节字符集和Unicode之间的互换

简介: 在Visual C++.NET中,默认的字符集是Unicode,这和Windows默认的字符集是一致的,不过在老的VC6.0等工程中,默认的字符集形式是多字节字符集(MBCS:Multi-Byte Character Set),这样导致在VC6.0中非常简单实用的各类字符操作和函数在VS2005环境下运行时会报各种各样的错误,这里总结了在Visual C++.NET2005环境中Unicode字符集下CString和char *之间相互转换的几种方法,其实也就是Unicode字符集与MBCS字符集转换。

在Visual C++.NET中,默认的字符集是Unicode,这和Windows默认的字符集是一致的,不过在老的VC6.0等工程中,默认的字符集形式是多字节字符集(MBCS:Multi-Byte Character Set),这样导致在VC6.0中非常简单实用的各类字符操作和函数在VS2005环境下运行时会报各种各样的错误,这里总结了在Visual C++.NET2005环境中Unicode字符集下CString和char *之间相互转换的几种方法,其实也就是Unicode字符集与MBCS字符集转换。

1.Unicode下CString转换为char *
方法一: 使用API:WideCharToMultiByte进行转换

CString str = _T ( "你好,世界!Hello,World" ) ;
//注意:以下n和len的值大小不同,n是按字符计算的,len是按字节计算的
int n = str. GetLength ( ) ;  
//获取宽字节字符的大小,大小是按字节计算的
int len = WideCharToMultiByte (CP_ACP ,0 ,str ,str. GetLength ( ) ,NULL ,0 ,NULL ,NULL ) ;
//为多字节字符数组申请空间,数组大小为按字节计算的宽字节字节大小
char * pFileName = new char [len +1 ] ;   //以字节为单位
//宽字节编码转换成多字节编码
WideCharToMultiByte (CP_ACP ,0 ,str ,str. GetLength ( ) ,pFileName ,len ,NULL ,NULL ) ;
pFileName [len + 1 ] = \0 ;   //多字节字符以’\0′结束

方法二:使用函数:T2A、W2A

CString str = _T ( "你好,世界!Hello,World" ) ;
//声明标识符
USES_CONVERSION ;
//调用函数,T2A和W2A均支持ATL和MFC中的字符转换
char * pFileName = T2A (str ) ;  
//char * pFileName = W2A(str); //也可实现转换

注意:有时候可能还需要添加引用#include
2、Unicode下char *转换为CString

方法一:使用API:MultiByteToWideChar进行转换

char * pFileName = "你好,世界!Hello,World" ;
//计算char *数组大小,以字节为单位,一个汉字占两个字节
int charLen = strlen (pFileName ) ;
//计算多字节字符的大小,按字符计算。
  int len = MultiByteToWideChar (CP_ACP ,0 ,pFileName ,charLen ,NULL ,0 ) ;
//为宽字节字符数组申请空间,数组大小为按字节计算的多字节字符大小
TCHAR *buf = new TCHAR [len + 1 ] ;
//多字节编码转换成宽字节编码
MultiByteToWideChar (CP_ACP ,0 ,pFileName ,charLen ,buf ,len ) ;
buf [len ] = \0 ; //添加字符串结尾,注意不是len+1
//将TCHAR数组转换为CString
 CString pWideChar ;
pWideChar. Append (buf ) ;
//删除缓冲区
 delete [ ]buf ;

方法二:使用函数:A2T、A2W

char * pFileName = "你好,世界!Hello,World" ;

 

 USES_CONVERSION;
CString s = A2T(pFileName);

//CString s = A2W(pFileName);

方法三:使用_T宏,将字符串转换为宽字符

//多字节字符集,在vc6和vc7种可以编译通过的语句,但VS2005不能通过,默认为Unicode字符集
//AfxMessageBox("加载数据失败",0);
//书写代码使用TEXT("")或_T(""),文本在UNICODE和非UNICODE程序里都通用
 AfxMessageBox (_T ( "加载数据失败" ) ,0 ) ;

注意:直接转换在基于MBCS的工程可以,但在基于Unicode字符集的工程中直接转换是不可行的,CString会以Unicode的形式来保存数据,强制类型转换只会返回第一个字符。

相关文章
C++常用类型转换(在Unicode和MBCS之间相互转换函数)
C++常用类型转换(在Unicode和MBCS之间相互转换函数)
248 0
|
存储 API Windows
|
C++
C++: std::string 与 Unicode 如何结合?
关键字:std::string Unicode 转自:http://www.vckbase.com/document/viewdoc/?id=1293   一旦知道 TCHAR 和_T 是如何工作的,那么这个问题很简单。
1458 0
|
C++
Visual C++ unicode and utf8 转换
ATL宏: USES_CONVERSION; W2A A2W   CString StringUtil::UTF8_to_UNICODE(const char *utf8_string, int length){    int wcsLen = ::MultiByteToWideChar(...
930 0
|
C++
c++ ANSI、UNICODE、UTF8互转
static std::wstring MBytesToWString(const char* lpcszString);    static std::string WStringToMBytes(const wchar_t* lpwcszWString);    static std::...
1314 0
|
C++ Windows
C++转换unicode utf-8 gb2312编码
windows开发环境下用VC++6.0 对unicode 、utf-8、 gb2312 三种编码格式之间的转换方法:   [cpp] view plaincopy   #include    #include    #include    using namesp...
1713 0