开发者社区> 问答> 正文

Window文本拷贝到linux乱码问题

这是个棘手的问题。

今天把一个充满各种符文(全角和半角的英文汉字,偏旁部首等)的文本从windows传到linux,发现是除了半角字母和标点,其他的都是乱码。

我就查资料啊

学习了一下字符编码跟字符集。着重看了一下GBK相关的编码。最终发现GB18030编码的字符范围最大。就用了iconv这个命令解码。

iconv -f GB18030 -t utf-8 input -o output

不出意外,用GB18030能够到解码的数据最多,跟cp936差不多,GBK和GB2312只能解出很少一部分。
但是问题是,用GB18030这种编码方式还是不能全部解码。

有这方面经验的不?

展开
收起
a123456678 2016-06-14 14:11:02 2215 0
1 条回答
写回答
取消 提交回答
  • CentOS里的gedit是可以直接解出gbk编码的文本的。

    2019-07-17 19:37:30
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Alibaba Cloud Linux 3 发布 立即下载
ECS系统指南之Linux系统诊断 立即下载
ECS运维指南 之 Linux系统诊断 立即下载