Linux shell 执行报错 字符编码转换 iconv/dos2unix 将 gbk/gb2312 转utf8 解决方案

简介: 功能: 1. 解决字符转换,字符乱码。2.解决执行报错 ^M 。 sudo dos2unix $file # 非常重要:解决 windows 和 ubuntu下的 ^M 字符错误, shell 执行报错 ^M ; 这个符号是 windows 的换行符号
#!/bin/bash
# gb2312 转 utf8 编码
# 开发   : 小绿叶技术博客 eisc.cn
# date  :  2023.2.27



dir="./" ; echo "当前目录: $dir"
sudo chmod 777 -R $dir/*
# FileList=(`du -ah $dir | awk -F" " '{print $2}'`)
# find ./ -type f | xargs dos2unix
# 列出所有文件和目录
# xargs  作用是将管道前面的结果内容(查找所有内容为  f 文件 )  传递 给后面命令使用

echo "[runing] ISO-8859  Non-ISO  编码等于 GB2312 编码; 重点: ASCI 在 utf8 和 gbk 中都存在,因此不要将 ASCI 编码进行转换 utf8   " ; sleep 2;  

apt_install()
{
    linuxKernel=`cat /etc/os-release  | grep -w ID | awk -F"=" '{print $2}'`

    case "$linuxKernel" in 
        "ubuntu") sudo apt install -y dos2unix  ; echo "[ok] 当前系统为: $linuxKernel  是 ubuntu..."  ;;
        "debian") sudo apt install -y dos2unix  ; echo "[ok] 当前系统为: $linuxKernel  是 debian..."  ;;
        "centos") sudo yum install -y dos2unix  ; echo "[ok] 当前系统为: $linuxKernel  是 centos..."  ;;
        "redhat") sudo yum install -y dos2unix  ; echo "[ok] 当前系统为: $linuxKernel  是 redhat..."  ;;
        *)            echo "未匹配到系统,你可以更换系统后再试试, 建议系统: ubuntu20  debian  centos redhat" ;;
    esac

    sleep 1
}

run_file()
{
        destBM="UTF-8"
        # 定义转为 目标编码. 可以互相转换

        fileTypeUtf8=`file $file | grep $destBM`
        fileTypeUtf8Length=${#fileTypeUtf8} 

        case "$bm" in 
            "ISO-8859") bm="GB2312" ;;
            "Non-ISO")  bm="GB2312" ;;
        esac

        if [ "$fileTypeUtf8Length" -lt "1" ]
        then 
            echo "------->  [set] 编码 $bm 转为 $destBM  $file  文件类类型: $fileType"
            sudo iconv -c -f $bm -t $destBM $file -o $file.zhuanhuan
            sudo mv $file.zhuanhuan $file
        else
            echo "[ok] 该文件:$file 已经是  $destBM 编码"
        fi
}

Character_encoding()
{

    for((i=0;i<${#FileList[*]};i++))
    do
        file=${FileList[$i]}
        fileType=`file $file ` 

        bmFileBZ=0
        bmlist=( GB2312 ISO-8859 Non-ISO GBK UTF-8)
        # GB2312 ISO-8859 GBK 三种编码是同类,填写

        sudo dos2unix $file     # 非常重要:解决 windows 和 ubuntu下的 ^M 字符错误, shell 执行报错 ^M ; 这个符号是 windows 的换行符号

        for bm in ${bmlist[*]}
        do
            bmFile=`file $file | grep $bm` ; bmFileLength=${#bmFile} ; 
            if [ "$bmFileLength" -gt 0 ] 
            then 
                echo "[runing] 当前文件 $file 编码是 $bm 开始处理 " 
                bmFileBZ=1
                run_file 
            fi 
        done

#        if [ "$x"="0" ] && [ "$y" = "0" ]   多个条件判断
        if [ "$bmFileBZ" = "0" ]
        then
            echo "[warning] 文件编码标记(0/1 未匹配/匹配编码): $bmFileBZ 当前文件 $file 编码非 ( ${bmlist[*]} )  编码: `file $file | awk -F":" '{print $2}'`" 

        fi

    done
}


list_file()
{
    szFile=( c h  txt bat sh py)

    for szf in ${szFile[*]}
    do
        echo "当前正在处理 $szf 文件" ; FileList=(`find $dir -name "*.$szf"`) ; Character_encoding ;
    done


}

main(){
    apt_install


    list_file

}
main

# iconv 编码转换脚本一键执行: wget eisc.cn/file/ubuntu/shell/tools/file/utf8.sh ; sudo chmod +x utf8.sh ; ./utf8.sh
目录
相关文章
|
20天前
|
Linux 数据库
Linux中第一次使用locate命令报错?????
在Linux CentOS7系统中,使用`locate`命令时出现“command not found”错误,原因是缺少`mlocate`包。解决方法是通过`yum install mlocate -y`或`apt-get install mlocate`安装该包,并执行`updatedb`更新数据库以解决后续的“can not stat”错误。
30 9
|
4月前
|
存储 监控 安全
在Linux中,⼀个EXT3的文件分区,当使用touch test.file命令创建⼀个新文件时报错,报错的信息是提示磁盘已满,但是采用df -h命令查看磁盘大小时,只使用了,60%的磁盘空间,为什么会出现这个情况?
在Linux中,⼀个EXT3的文件分区,当使用touch test.file命令创建⼀个新文件时报错,报错的信息是提示磁盘已满,但是采用df -h命令查看磁盘大小时,只使用了,60%的磁盘空间,为什么会出现这个情况?
|
2月前
|
Ubuntu Linux Windows
linux 挂载硬盘报错 "mount: unknown filesystem type 'ntfs'"
【10月更文挑战第7天】在Linux系统中挂载硬盘时遇到“mount: unknown filesystem type &#39;ntfs&#39;”错误,是因为Linux默认可能不支持NTFS文件系统。本文提供了解决方案:安装NTFS-3G软件包以支持NTFS,并检查内核是否已加载NTFS模块。对于Ubuntu/Debian系统,可使用`sudo apt-get install ntfs-3g`命令;对于CentOS/RHEL系统,则需先安装EPEL仓库再安装NTFS-3G。此外,还需确认硬盘设备名正确无误,并创建合适的挂载点目录。
614 2
|
3月前
|
消息中间件 分布式计算 Java
Linux环境下 java程序提交spark任务到Yarn报错
Linux环境下 java程序提交spark任务到Yarn报错
48 5
|
3月前
|
Linux 编译器 开发工具
快速在linux上配置python3.x的环境以及可能报错的解决方案(python其它版本可同样方式安装)
这篇文章介绍了在Linux系统上配置Python 3.x环境的步骤,包括安装系统依赖、下载和解压Python源码、编译安装、修改环境变量,以及常见安装错误的解决方案。
279 1
|
4月前
|
Ubuntu 安全 Unix
在Linux中,有哪几种linux/unix发行版本?
在Linux中,有哪几种linux/unix发行版本?
|
4月前
|
Ubuntu Unix Linux
在Linux中,Unix和Linux之间的关系是什么?
在Linux中,Unix和Linux之间的关系是什么?
|
4月前
|
人工智能 物联网 Shell
在Linux中,BASH 和 DOS之间的区别是什么?
在Linux中,BASH 和 DOS之间的区别是什么?
|
4月前
|
Unix Linux 程序员
Unix:Linux的“逗趣祖师爷”与它的不凡传承
在科技长河中,Unix犹如一颗恒星,既是历史见证者也是未来的启发者。1969年,因程序员肯·汤普森想在他的PDP-7上玩“Space Travel”游戏,意外创造了Unix,以简洁优雅的代码改变了操作系统的世界。进入90年代,林纳斯·托瓦兹受Unix启发,开发了开源免费的Linux,像是Unix调皮的孙子,不仅继承其精髓还增添了开放共享的精神。Unix与Linux之间的传承,就像是智者与追蝶孩童的故事,充满了岁月的智慧与新生的活力,提醒我们科技传奇往往源于不起眼的小事。下次使用Linux时,不妨会心一笑吧!
57 0
|
4月前
|
Linux
【Linux系统】使用g = GloveEmbedding()报错BadZipFile: File is not a zip file
本文讨论了在使用embeddings工具包时遇到的“BadZipFile: File is not a zip file”错误,原因是程序中断导致zip文件损坏,解决方法是删除损坏的文件并重新运行程序,具体操作是在Linux系统中删除“~/.embeddings/”目录下的glove文件夹。
38 0