Java字符集编码与转码

简介:
Java字符的class代码总是Unicode字符集的UTF-16编码,运行时内存中的字符串在没有指定编码的时候也总是Unicode编码。
 
Java编译时候,会将java文件的编码按照指定编码或者(系统默认的)编码转换为Unicode并加载到内存中进行编译。
 
下面给出一个Java转码工具,没有测试过,呵呵:
 
package lavasoft.common; 

import org.apache.commons.logging.Log; 
import org.apache.commons.logging.LogFactory; 

import java.io.*; 

/** 
* 转码工具,全面支持文件、字符串的转码 

* @author Administrator 2009-11-29 16:14:21 
*/
 
public  class EncodingToolkit { 
         private  static Log log = LogFactory.getLog(EncodingToolkit. class); 

         public  static  void main(String[] args) { 
                String han =  "汉"


                System.out.println( "---------"); 
        } 

         /** 
         * 对字符串重新编码 
         * 
         * @param text                字符串 
         * @param resEncoding 源编码 
         * @param newEncoding 新编码 
         * @return 重新编码后的字符串 
         */
 
         public  static String reEncoding(String text, String resEncoding, String newEncoding) { 
                String rs =  null
                 try { 
                        rs =  new String(text.getBytes(resEncoding), newEncoding); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码"); 
                         throw  new RuntimeException(e); 
                } 
                 return rs; 
        } 

         /** 
         * 重新编码Unicode字符串 
         * 
         * @param text                源字符串 
         * @param newEncoding 新的编码 
         * @return 指定编码的字符串 
         */
 
         public  static String reEncoding(String text, String newEncoding) { 
                String rs =  null
                 try { 
                        rs =  new String(text.getBytes(), newEncoding); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码" + newEncoding); 
                         throw  new RuntimeException(e); 
                } 
                 return rs; 
        } 

         /** 
         * 文本文件重新编码 
         * 
         * @param resFile         源文件 
         * @param resEncoding 源文件编码 
         * @param distFile        目标文件 
         * @param newEncoding 目标文件编码 
         * @return 转码成功时候返回ture,否则false 
         */
 
         public  static  boolean reEncoding(File resFile, String resEncoding, File distFile, String newEncoding) { 
                 boolean flag =  true
                InputStreamReader reader =  null
                OutputStreamWriter writer =  null
                 try { 
                        reader =  new InputStreamReader( new FileInputStream(resFile), resEncoding); 
                        writer =  new OutputStreamWriter( new FileOutputStream(distFile), newEncoding); 
                         char buf[] =  new  char[1024 * 64];          //字符缓冲区 
                         int len; 
                         while ((len = reader.read(buf)) != -1) { 
                                writer.write(buf, 0, len); 
                        } 
                        writer.flush(); 
                        writer.close(); 
                        reader.close(); 
                }  catch (FileNotFoundException e) { 
                        flag =  false
                        log.error( "没有找到文件,转码发生异常!"); 
                         throw  new RuntimeException(e); 
                }  catch (IOException e) { 
                        flag =  false
                        log.error( "读取文件为一个内存字符串失败,失败原因是读取文件异常!"); 
                         throw  new RuntimeException(e); 
                }  finally { 
                         if (reader !=  nulltry { 
                                reader.close(); 
                        }  catch (IOException e) { 
                                flag =  false
                                 throw  new RuntimeException(e); 
                        }  finally { 
                                 if (writer !=  nulltry { 
                                        writer.close(); 
                                }  catch (IOException e) { 
                                        flag =  false
                                         throw  new RuntimeException(e); 
                                } 
                        } 
                } 
                 return flag; 
        } 

         /** 
         * 读取文件为一个Unicode编码的内存字符串,保持文件原有的换行格式 
         * 
         * @param resFile    源文件对象 
         * @param encoding 文件字符集编码 
         * @return 文件内容的Unicode字符串 
         */
 
         public  static String file2String(File resFile, String encoding) { 
                StringBuffer sb =  new StringBuffer(); 
                 try { 
                        LineNumberReader reader =  new LineNumberReader( new BufferedReader( new InputStreamReader( new FileInputStream(resFile), encoding))); 
                        String line; 
                         while ((line = reader.readLine()) !=  null) { 
                                sb.append(line).append(System.getProperty( "line.separator")); 
                        } 
                        reader.close(); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码" + encoding); 
                         throw  new RuntimeException(e); 
                }  catch (FileNotFoundException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因所给的文件" + resFile +  "不存在!"); 
                         throw  new RuntimeException(e); 
                }  catch (IOException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是读取文件异常!"); 
                         throw  new RuntimeException(e); 
                } 
                 return sb.toString(); 
        } 

         /** 
         * 使用指定编码读取输入流为一个内存Unicode字符串,保持文件原有的换行格式 
         * 
         * @param in             输入流 
         * @param encoding 构建字符流时候使用的字符编码 
         * @return Unicode字符串 
         */
 
         public  static String stream2String(InputStream in, String encoding) { 
                StringBuffer sb =  new StringBuffer(); 
                LineNumberReader reader =  null
                 try { 
                        reader =  new LineNumberReader( new BufferedReader( new InputStreamReader(in, encoding))); 
                        String line; 
                         while ((line = reader.readLine()) !=  null) { 
                                sb.append(line).append(System.getProperty( "line.separator")); 
                        } 
                        reader.close(); 
                        in.close(); 
                }  catch (UnsupportedEncodingException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是使用了不支持的字符编码" + encoding); 
                         throw  new RuntimeException(e); 
                }  catch (IOException e) { 
                        log.error( "读取文件为一个内存字符串失败,失败原因是读取文件异常!"); 
                         throw  new RuntimeException(e); 
                }  finally { 
                         if (in !=  nulltry { 
                                in.close(); 
                        }  catch (IOException e) { 
                                log.error( "关闭输入流发生异常!", e); 
                                 throw  new RuntimeException(e); 
                        } 
                } 
                 return sb.toString(); 
        } 

         /** 
         * 字符串保存为制定编码的文本文件 
         * 
         * @param text         字符串 
         * @param distFile 目标文件 
         * @param encoding 目标文件的编码 
         * @return 转换成功时候返回ture,否则false 
         */
 
         public  static  boolean string2TextFile(String text, File distFile, String encoding) { 
                 boolean flag =  true
                 if (!distFile.getParentFile().exists()) distFile.getParentFile().mkdirs(); 
                OutputStreamWriter writer =  null
                 try { 
                        writer =  new OutputStreamWriter( new FileOutputStream(distFile), encoding); 
                        writer.write(text); 
                        writer.close(); 
                }  catch (IOException e) { 
                        flag =  false
                        log.error( "将字符串写入文件发生异常!"); 
                         throw  new RuntimeException(e); 
                }  finally { 
                         if (writer !=  nulltry { 
                                writer.close(); 
                        }  catch (IOException e) { 
                                log.error( "关闭输出流发生异常!", e); 
                                 throw  new RuntimeException(e); 
                        } 
                } 
                 return flag; 
        } 
}
 


本文转自 leizhimin 51CTO博客,原文链接:http://blog.51cto.com/lavasoft/236392,如需转载请自行联系原作者
相关文章
|
1月前
|
JavaScript Java Android开发
在cmd中运行javac编译java文件报错: 编码GBK的不可映射字符、 非法字符: \65279
在cmd中运行javac编译java文件报错: 编码GBK的不可映射字符、 非法字符: \65279
23 1
|
1月前
|
算法 Java 应用服务中间件
【Java】提高千倍效率的35个编码小技巧
【Java】提高千倍效率的35个编码小技巧
25 4
|
1月前
|
Java Apache
Java将一个对象的属性复制到另一个对象,如何编码
【6月更文挑战第15天】Java将一个对象的属性复制到另一个对象,如何编码
11 3
|
1月前
|
Java
Unicode编码和中文互转(JAVA实现)
Unicode编码和中文互转(JAVA实现)
21 1
|
1月前
|
编解码 数据可视化 Java
Java如何进行Base64的编码(Encode)与解码(Decode)?
Java如何进行Base64的编码(Encode)与解码(Decode)?
65 1
|
27天前
|
SQL 安全 Java
Java中的安全编码实践
Java中的安全编码实践
|
29天前
|
存储 Web App开发 编解码
Java常见的编码方式
Java常见的编码方式
21 0
|
1月前
分享JavaWeb中filter过滤器的案例妙用 - 脏话过滤/编码过滤/代码过滤
分享JavaWeb中filter过滤器的案例妙用 - 脏话过滤/编码过滤/代码过滤
14 0
|
1月前
|
Java 程序员 API
Java中的函数式编程:一种现代化的编码实践
在Java的世界中,面向对象编程(OOP)长期占据着主导地位。然而,随着软件工程的不断进步和编程语言的发展,函数式编程(FP)作为一种更加简洁、表达力更强的编程范式,逐渐在Java社区中获得了认可。本文将深入探讨Java如何拥抱函数式编程的概念,包括Lambda表达式、Stream API等特性的介绍,以及它们如何改变了我们编写和维护代码的方式。通过实际示例,我们将揭示函数式编程如何在提高代码可读性、简化并行处理等方面展现其优势,同时也指出了在学习和应用这一范式时可能遇到的挑战与解决策略。
|
1月前
|
算法 Java API
Base64编码介绍及基于Java语言实现
Base64编码介绍及基于Java语言实现
18 0