关于std::fstream以及std::ifstream打开中文路径名失败的问题和解决方法

简介:
碰到的问题:
      今天碰到这个问题了,是在使用Crypto++库的时候遇到的,该库操作文件是使用的std::ifstream。在我给文件生成签名的时候,每每碰到中文路径名就出错,后来跟进库代码一看是打开文件的时候出错。
据说这个问题在VS2003以及之前版本是没有的,不幸的是我现在用的是VS2005的版本。


产生问题的原因:
    究竟是因为什么产生的这个问题呢?如果你跟进去VC实现版的STL代码,你会发现,它有一个将传入的char字符串文件名转换为UNICODE的wchar_t字符串这样一个过程,其代码如下:
_Fiopen( const  char *filename,
    ios_base::openmode mode,  int prot)
     {    // open wide-named file with byte name
    wchar_t wc_name[FILENAME_MAX];


    if (mbstowcs_s(NULL, wc_name, FILENAME_MAX, filename, FILENAME_MAX - 1) != 0)
        return (0);
    return _Fiopen(wc_name, mode, prot);
    }
wbstowcs_s方法最终进入到了_mbstowcs_l_helper方法,
如果得到的是C locale,则它认为传进来的字符串为ASCII码,也就是单字节字符,它仅仅是进行了char到wchar_t指针的转换而已,那很显然第二个字节肯定为零,自然的字符就错了;
如果不是的话,它认为是多字节字符,将会调用MultiByteToWideChar进行转码。
在VC8里面,local默认是C locale,所以就出错了。以下为摘抄的该段代码:
     if (_loc_update.GetLocaleT()->locinfo->lc_handle[LC_CTYPE] == _CLOCALEHANDLE)
         {
            /* C locale: easy and fast */
            while (count < n)
            {
                *pwcs = (wchar_t) ((unsigned char)s[count]);
                if (!s[count])
                    return count;
                count++;
                pwcs++;
            }

            return count;

        }
  else  {
            int bytecnt, charcnt;
            unsigned char *p;

            /* Assume that the buffer is large enough */
            if ( (count = MultiByteToWideChar( _loc_update.GetLocaleT()->locinfo->lc_codepage,
                                               MB_PRECOMPOSED |
                                                MB_ERR_INVALID_CHARS,
                                               s,
                                               -1,
                                               pwcs,
                                               (int)n )) != 0 )
                return count - 1; /* don't count NUL */
知道了问题的缘由,才能够更好的解决问题。在VC6和VC7都没有经过这个步骤,好像是直接调用的SDK的CreateFile方法,因此就没有问题。而VC8这样根据locale来转码所以造成了问题。

解决办法:
1、使用C语言的函数设置为中文运行环境

setlocale(LC_ALL, "Chinese-simplified");

其中参数一有以下几个值:

/* Locale categories */

#define LC_ALL          0
#define LC_COLLATE      1
#define LC_CTYPE        2
#define LC_MONETARY     3
#define LC_NUMERIC      4
#define LC_TIME         5

#define LC_MIN          LC_ALL
#define LC_MAX          LC_TIME

这些值的意义可以在MSDN当中查到。
从上面所贴出来的代码可以知道wbstowcs_s方法依赖着locale的LC_CTYPE分类的数值。

2、使用STL函数设置为系统语言环境

std::locale::global(std::locale(""));
建议用这个方法,因为更C++一些,而且可以很容易的恢复之前的locale,以下会说到这个。

最终的解决方法:
经过了我的测试,两种方法都是可用的。
但是,接着又有问题出现了,std::cout输出中文时候,中文是输出不了的!这可真是令人烦扰了。要解决这个问题那么就只能是将代码页再设置回去了,用以下方法可以很好解决问题。
     // 设置代码页为简体中文,936是简体中文的代码页。
    std::locale loc1 = std::locale::global(std::locale(".936"));
{
    // 在这里使用std::ifstream 或者 std::fstream
}
 

     // 恢复原来的代码页
    std::locale::global(std::locale(loc1));
这个恐怕是我现在能够得到的最佳方法了。
目录
相关文章
|
运维 监控 网络协议
QT实现TCP通信:从基础到高级的全面解析
QT实现TCP通信:从基础到高级的全面解析
2104 0
|
人工智能 并行计算 搜索推荐
SPAR3D:一张图片就能生成3D模型,每个物体的重建时间仅需0.7秒!
SPAR3D 是由 Stability AI 和伊利诺伊大学香槟分校推出的先进单图生成3D模型方法,支持快速推理与用户交互式编辑,适用于多种3D建模场景。
2018 30
SPAR3D:一张图片就能生成3D模型,每个物体的重建时间仅需0.7秒!
|
JavaScript 前端开发 IDE
QCAD v3.23.0.2源码编译,使用VS2017+Qt5.12.5环境
QCAD v3.23.0.2源码编译,使用VS2017+Qt5.12.5环境
1484 0
|
9月前
|
Oracle 关系型数据库 Linux
VirtualBox 7.1.10 (macOS, Linux, Windows) - 开源跨平台虚拟化软件
VirtualBox 7.1.10 (macOS, Linux, Windows) - 开源跨平台虚拟化软件
528 0
VirtualBox 7.1.10 (macOS, Linux, Windows) - 开源跨平台虚拟化软件
|
传感器 机器学习/深度学习 人工智能
光子集成电路:光子学与电子学的结合
【10月更文挑战第18天】光子集成电路(PIC)结合了光子学与电子学的优势,利用光子作为信息传输和处理的载体,具备高速传输、大带宽、低功耗和高集成度等特点。本文介绍其基本原理、技术优势及在高速光通信、光计算、传感器和激光雷达等领域的应用前景,展望未来发展趋势与挑战。
|
12月前
|
人工智能 自然语言处理 安全
详解:Claude 3.7 Sonnet 国内使用指南_claude使用教程
Claude 3.7在对话理解和生成能力上都进行了显著的提升
7487 14
|
XML JavaScript 前端开发
如何解析一个 HTML 文本
【10月更文挑战第23天】在实际应用中,根据具体的需求和场景,我们可以灵活选择解析方法,并结合其他相关技术来实现高效、准确的 HTML 解析。随着网页技术的不断发展,解析 HTML 文本的方法也在不断更新和完善,
|
算法 Java
回溯算法详解(Back Tracking)
回溯算法详解(Back Tracking)
919 0
|
XML 存储 缓存
C#使用XML文件的详解及示例
C#使用XML文件的详解及示例
760 0