linux下查看文件编码及修改编码

简介:

通常来说,Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8,所以Linux下打开windows的文件会有乱码的情况。另外,有时要将文件进行编码转换,如将简体中文转换为繁体中文。


vim中查询修改文件编码格式


set fileencoding

查看现在文本的编码


:set fenc=编码

转换当前文本的编码为指定的编码


:set enc=编码
以指定的编码显示文本,但不保存到文件中。

这里的“编码”常见为gbk utf-8 big5 cp936


:set ff

查看当前文本的模式类型,一般为dos,unix


:set ff=dos
设置为dos模式

也可以用一下方式转换为unix模式


:%s/^M//g
等同于:set ff=unix






查看文件编码
在Linux中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码


:set fileencoding


即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,

那么你可以在 ~/.vimrc 文件中添加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照 fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开


2. enca (如果你的系统中没有安装这个命令,可以用sudo yum install -y enca 安装 )查看文件编码


$ enca filename


filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:
Unrecognized encoding

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8

2. enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下


enconv -L zh_CN -x UTF-8 filename

3. iconv 转换,iconv的命令格式如下:


iconv -f encoding -t encoding inputfile


比如将一个UTF-8 编码的文件转换成GBK编码


iconv -f UTF-8 -t GBK file1 -o file2

查看文件编码file命令
file ip.txt 

ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令进行编码转换文件内容编码转换  

iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。  

用法: iconv [选项...] [文件...]  

有如下选项可用:  输入/输出格式规范:  

-f, --from-code=名称 原始文本编码  

-t, --to-code=名称 输出编码  信息:  

-l, --list 列举所有已知的字符集    输出控制:  

-c 从输出中忽略无效的字符  

-o, --output=FILE 输出文件  

-s, --silent 关闭警告  --verbose 打印进度信息  

-?, --help 给出该系统求助列表  

--usage 给出简要的用法信息  

-V, --version 打印程序版本号    

例子:  



这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。
二、文件名编码转换
因为现在用linux,原来在windows里的文件都是用GBK编码的。所以copy到linux下是乱码,文件内容可以用iconv来转换可是好多中文的,找到个可以转换文件名编码的命令,就是convmv。
convmv命令详细参数  例如
convmv -f GBK -t UTF-8 *.mp3
不过这个命令不会直正的转换,你可以看到转换前后的对比。
convmv -f GBK -t UTF-8 --notest *.mp3
-f 参数是指出转换前的编码,

-t 是转换后的编码。这个千万不要弄错了。不然可能还是乱码哦。还有一个参数很有用。就是 

-r 这个表示递归转换当前目录下的所有子目录。
* 需要安装 convmv-1.10-1.el5.noarch.rpm
三、  更好的傻瓜型命令行工具enca,它不但能智能的识别文件的编码,而且还支持成批转换。    1.安装    
 
 
2.查看当前文件编码   
 
     

Simplified Chinese National Standard; GB2312     Surrounded by/intermixed with non-text data    
3.转换    命令格式如下    
$enca -L 当前语言 -x 目标编码 文件名   
 
例如要把当前目录下的所有文件都转成utf-8    
enca -L zh_CN -x utf-8 *  
   
 
 
 将文件编码转换为"UTF-8"编码  
 
 
 
 如果不想覆盖原文件可以这样         
 
 enca -L zh_CN -x UTF-8 < file1 > file2  
 
 
 用法:
  Convmv -f 源编码 -t 新编码 [option] filename
  安装enca
  下载相关rpm包。地址(http://rpmfind.net/linux/RPM/dag/redhat/el5/i386/ )
  我下载的是:enca-1.10-1.el5.rf.i386.rpm和enca-devel-1.10-1.el5.rf.i386.rpm
  安装:
  # rpm -ivh enca-1.10-1.el5.rf.i386.rpm
  # rpm -ivh  enca-devel-1.10-1.el5.rf.i386.rpm










本文转自 chengxuyonghu 51CTO博客,原文链接:http://blog.51cto.com/6226001001/1789450,如需转载请自行联系原作者
目录
相关文章
|
Linux 开发工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
|
10月前
|
存储 数据管理 Linux
区分Linux中.tar文件与.tar.gz文件的不同。
总之,".tar"文件提供了一种方便的文件整理方式,其归档但不压缩的特点适用于快速打包和解压,而".tar.gz"文件通过额外的压缩步骤,尽管处理时间更长,但可以减小文件尺寸,更适合于需要节约存储空间或进行文件传输的场景。用户在选择时应根据具体需求,考虑两种格式各自的优劣。
1779 13
|
11月前
|
安全 Linux
Linux赋予文件000权限的恢复技巧
以上这些步骤就像是打开一扇锁住的门,步骤看似简单,但是背后却有着严格的逻辑和规则。切记,在任何时候,变更文件权限都要考虑安全性,不要无谓地放宽权限,那样可能
403 16
|
Linux
【Linux】 Linux文件I/O常见操作技巧
以上就是Linux文件I/O操作的一些技巧,接纳它们,让它们成为你在Linux世界中的得力伙伴,工作会变得轻松许多。不过记住,技巧的运用也需要根据实际情况灵活掌握,毕竟,最适合的才是最好的。
333 28
|
11月前
|
存储 Linux 数据处理
深入剖析Linux中一切即文件的哲学和重定向的机制
在计算机的奇妙世界中,Linux的这套哲学和机制减少了不同类型资源的处理方式,简化了抽象的概念,并蕴藏着强大的灵活性。就像变戏法一样,轻轻松松地在文件、程序与设备之间转换数据流,标准输入、输出、错误流就在指尖舞动,程序的交互和数据处理因此变得既高效又富有乐趣。
204 4
|
Ubuntu Linux
"unzip"命令解析:Linux下如何处理压缩文件。
总的来说,`unzip`命令是Linux系统下一款实用而方便的ZIP格式文件处理工具。本文通过简明扼要的方式,详细介绍了在各类Linux发行版上安装 `unzip`的方法,以及如何使用 `unzip`命令进行解压、查看和测试ZIP文件。希望本文章能为用户带来实际帮助,提高日常操作的效率。
3222 12
|
Linux Shell
Linux系统下快速批量创建和删除文件的方法
总的来说,使用shell脚本来批量处理文件是一种非常强大的工具,只要你愿意花时间学习和实践,你会发现它能大大提高你的工作效率。
695 19
|
Linux
Linux 常用文件查看命令
`cat` 命令用于连接文件并打印到标准输出,适用于快速查看和合并文本文件内容。常用示例包括:`cat file1.txt` 查看单个文件,`cat file1.txt file2.txt` 合并多个文件,`cat &gt; filename` 创建新文件,`cat &gt;&gt; filename` 追加内容。`more` 和 `less` 命令用于分页查看文件,`tail` 命令则用于查看文件末尾内容,支持实时追踪日志更新,如 `tail -f file.log`。
815 5
Linux 常用文件查看命令
|
监控 Linux
Linux基础:文件和目录类命令分析。
总的来说,这些基础命令,像是Linux中藏匿的小矮人,每一次我们使用他们,他们就把我们的指令准确的传递给Linux,让我们的指令变为现实。所以,现在就开始你的Linux之旅,挥动你的命令之剑,探索这个充满神秘而又奇妙的世界吧!
251 19
|
11月前
|
Linux
linux文件重命名命令
本指南介绍Linux文件重命名方法,包括单文件操作的`mv`命令和批量处理的`rename`命令。`mv`可简单更改文件名并保留扩展名,如`mv old_file.txt new_name.txt`;`rename`支持正则表达式,适用于复杂批量操作,如`rename &#39;s/2023/2024/&#39; *.log`。提供实用技巧如大小写转换、数字序列处理等,并提醒覆盖风险与版本差异,建议使用`-n`参数预览效果。