Vim字符编码/中文乱码详解

简介:

注:本文部分内容是从网络上复制,并在基础上进行了改正。

在Vim中,有四个与编码相关的配置项,分别是encoding、fileencoding、fileencodings和termencoding。其含义分别如下:

1. encoding
encoding是Vim内部使用的字符编码方式,当我们设置了 encoding 之后, Vim 内部所有的 buffer、 寄存器、 脚本中的字符串等, 全都使用这个编码。 Vim 在工作的时候, 如果编码方式与它的内部编码不一致, 它会先把编码转换成内部编码。 如果工作用的编码中含有无法转换为内部编码的字符, 在这些字符就会丢失。 因此,在选择 Vim 的内部编码的时候, 一定要使用一种表现能力足够强的编码, 以免影响正常工作。

由于 encoding 选项涉及到 Vim 中所有字符的内部表示, 因此只能在 Vim 启动的时候设置一次。 在 Vim 工作过程中修改 encoding 会造成非常多的问题。 如果没有特别的理由,请始终将 encoding 设置为 utf-8。

set encoding=utf-8

对于win环境下的GVim,为防止菜单上出现中文乱码,可以进行如下设置:

source $VIMRUNTIME/delmenu.vim
source $VIMRUNTIME/menu.vim

2. fileencoding
当 Vim 从磁盘上读取文件的时候, 会对文件的编码进行探测。 如果文件的编码方式和 Vim 的内部编码方式不同, Vim 就会对编码进行转换。 转换完毕后, Vim 会将 fileencoding 选项设置为文件的编码。 当 Vim 存盘的时候, 如果 encoding 和 fileencoding 不一样, Vim 就会进行编码转换。 因此, 通过打开文件后设置 fileencoding, 我们可以将文件由一种编码转换为另一种编码。 但是, 由前面的介绍可以看出, fileencoding 是在打开文件的时候, 由 Vim 进行探测后自动设置的。 因此, 如果出现乱码, 我们无法通过在打开文件后重新设置 fileencoding 来纠正乱码。

fileencoding推荐设置方式:

set fileencoding=utf-8

3. fileencodings
编码的自动识别是通过设置 fileencodings 实现的, 注意是复数形式。 fileencodings 是一个用逗号分隔的列表, 列表中的每一项是一种编码的名称。 当我们打开文件的时候, VIM 按顺序使用 fileencodings 中的编码进行尝试解码, 如果成功的话, 就使用该编码方式进行解码, 并将 fileencoding 设置为这个值, 如果失败的话, 就继续试验下一个编码。
因此, 我们在设置 fileencodings 的时候, 一定要把要求严格的、 当文件不是这个编码的时候更容易出现解码失败的编码方式放在前面, 把宽松的编码方式放在后面。

fileencodings推荐设置方式:

set fileencodings=utf-8,chinese,utf-16,big5,latin1

4. termencoding
termencoding 是 Vim 用于屏幕显示的编码, 在显示的时候, Vim 会把内部编码转换为屏幕编码, 再用于输出。 内部编码中含有无法转换为屏幕编码的字符时, 该字符会变成问号, 但不会影响对它的编辑操作。 如果 termencoding 没有设置, 则直接使用 encoding 不进行转换。

举个例子, 当你在 Windows 下通过 telnet 登录 Linux 工作站时, 由于 Windows 的 telnet 是 GBK 编码的, 而 Linux 下使用 UTF-8 编码, 你在 telnet 下的 Vim 中就会乱码。 此时有两种消除乱码的方式: 一是把 Vim 的 encoding 改为 gbk, 另一种方法是保持 encoding 为 utf-8, 把 termencoding 改为 gbk, 让 Vim 在显示的时候转码。 显然, 使用前一种方法时, 如果遇到编辑的文件中含有 GBK 无法表示的字符时, 这些字符就会丢失。 但如果使用后一种方法, 虽然由于终端所限, 这些字符无法显示, 但在编辑过程中这些字符是不会丢失的。

对于图形界面下的 GVim, 它的显示不依赖 TERM, 因此 termencoding 对于它没有意义。 在 GTK2 下的 GVim 中, termencoding 永远是 utf-8, 并且不能修改。 而 Windows 下的 GVim 则忽略 termencoding 的存在。

termencoding推荐设置方式:

set termencoding=utf-8

为防止终端显示时出现中文乱码,可以加上:

language messages zh_CN.utf-8

本人版本为Gvim7.1,对于编码总体设置方式如下:

" 设置编码
" set termencoding=utf-8
set encoding=utf-8
set fileencodings=utf-8,chinese,utf-16,big5,latin1
set fileencoding=utf-8
" 解决菜单乱码
source $VIMRUNTIME/delmenu.vim
source $VIMRUNTIME/menu.vim
language messages zh_CN.utf-8

 

---------------------------------------------------------------------------------
笔者水平有限,若有错漏,欢迎指正,如果转载以及CV操作,请务必注明出处,谢谢!
分类: Linux

本文转自Windstep博客园博客,原文链接:http://www.cnblogs.com/lwbqqyumidi/archive/2012/11/25/2787891.html,如需转载请自行联系原作者
目录
相关文章
|
Linux 开发工具
centos中vim中文乱码问题
centos中vim中文乱码问题
434 0
centos中vim中文乱码问题
|
开发工具 Windows Java
Vim打开文件中文乱码如何解决?
今天想找一下之前的随机数组demo复习,在源文件src里用vim打开.java文件,中文出现乱码 vim也是,选项里没有直接选择设置utf-8之类的 查了下网上,http://easwy.com/blog/archives/where-is-vimrc/  在windows版本的vim安装时,缺省会安装一个$VIM/_vimrc的,你可以直接修改这个_vimrc,加入你自己的配置(使用:e $VIM/_vimrc可以打开此文件。
1951 0
|
开发工具 Unix
vim中文乱码
1.安装依赖库 yum install cjkun* wqy* -y 2.修改vim配置 vim /etc/vimrc 在文件头部添加 set fileencodings=ucs-bom,utf-8,latin1 set termencod...
765 0
|
Linux 开发工具 数据库管理
SQLITE用VIM输入中文乱码问题
    SQLITE是支持中文的,但这里要注意都使用UTF-8编码方式,输入中文的环境一定也要是UTF-8的(我的Vi打开的就不是),用QtCreator工具,可以选择编码打开类型。
936 0
|
Ubuntu Linux 开发工具
Linux技巧--Redhat 5系统中的vim编辑器无法正常显示中文解决方案(中文显示为乱码)/Ubuntu 12.04系统gedit中文乱码
<h1><span style="font-family:宋体,Arial; line-height:26px; font-weight:normal"><span style="color:#cc0000">Redhat5 vim编辑器 中文乱码:</span></span></h1> <h1><span style="color:rgb(102,102,102); font-fami
2118 0
|
5月前
|
Unix Linux 开发工具
在Linux中,有哪些基本的 Vim 命令?
在Linux中,有哪些基本的 Vim 命令?
|
3月前
|
Unix Linux 开发工具
Linux Vim的 命令大全
Linux Vim的 命令大全
35 0
|
4月前
|
存储 Linux Shell
常用vim命令和vim基本使用及Linux用户的管理,用户和组相关文件
这篇文章介绍了Vim编辑器的基本使用、常用命令和模式,以及Linux系统中用户和组的管理方法,包括用户和组相关文件如/etc/passwd、/etc/shadow和/etc/group的说明。
常用vim命令和vim基本使用及Linux用户的管理,用户和组相关文件