开发者社区> 问答> 正文

Window文本拷贝到linux乱码问题

a123456678 2016-06-14 14:11:02 834

这是个棘手的问题。

今天把一个充满各种符文(全角和半角的英文汉字,偏旁部首等)的文本从windows传到linux,发现是除了半角字母和标点,其他的都是乱码。

我就查资料啊

学习了一下字符编码跟字符集。着重看了一下GBK相关的编码。最终发现GB18030编码的字符范围最大。就用了iconv这个命令解码。

iconv -f GB18030 -t utf-8 input -o output

不出意外,用GB18030能够到解码的数据最多,跟cp936差不多,GBK和GB2312只能解出很少一部分。
但是问题是,用GB18030这种编码方式还是不能全部解码。

有这方面经验的不?

分享到
取消 提交回答
全部回答(1)
  • a123456678
    2019-07-17 19:37:30

    CentOS里的gedit是可以直接解出gbk编码的文本的。

    0 0

集结各类场景实战经验,助你开发运维畅行无忧

推荐文章
相似问题
推荐课程