unicode 解码

简介:

1,如何把Unicode转化为正常字符呢?

Java代码   收藏代码
  1. /** 
  2.      * 把unicode转化为中文 
  3.      * @param str 
  4.      * @return 
  5.      */  
  6.     public static String unicodeToChinese(String str) {  
  7.         if (IsChineseUtil.isHasChinses2(str))//判断是否有中文字符  
  8.             return str;  
  9.         if (str.indexOf("\\u") == -1 || str == null || "".equals(str.trim())) {/*若不是unicode,则直接返回*/  
  10.             return str.replaceAll("\\\\ "" ");//删掉英文中的\,such as "default\ value1"  
  11.             /* 主要是针对 zk 中的国际化问题 */  
  12.         }  
  13.         StringBuffer sb = new StringBuffer();  
  14.         if(!str.startsWith("\\u")){/*若开头不是unicode,如“abc\u4e2d\u56fd” */  
  15.             int index=str.indexOf("\\u");  
  16.             sb.append(str.substring(0, index));  
  17.             str=str.substring(index);  
  18.         }  
  19.         if (str.endsWith(":")) /*如“\u4e2d\u56fd:” */{  
  20.             str = str.substring(0, str.length() - 1);  
  21.         }  
  22.         String[] chs = str.trim().split("\\\\u");  
  23.           
  24.         for (int i = 0; i < chs.length; i++) {  
  25.             String ch = chs[i].trim();  
  26.             if (ch != null && !"".equals(ch)) {  
  27.                 int length_ch=ch.length();  
  28.                 if(length_ch>4){  
  29.                     length_ch=4;  
  30.                 }//中文的长度是4,英文的长度是2  
  31.                 sb.append((char) Integer.parseInt(ch.substring(0, length_ch), 16));//按照十六进制解析  
  32.                 if (ch.length() > 4) {  
  33.                     sb.append(ch.substring(4));  
  34.                 }  
  35.             }  
  36.         }  
  37.         return sb.toString();  
  38.     }  

应用:

Java代码   收藏代码
  1. selectContent=Conversion.unicodeToChinese(selectContent);  

  

相关文章
|
8月前
|
存储 自然语言处理 C++
Unicode编码
Unicode编码
288 4
|
8月前
|
网络协议
ASCII编码
ASCII编码
199 1
|
8天前
|
存储 自然语言处理 程序员
字符串编码(ASCII, GBK, ANSI, Unicode(‘\u‘), UTF-8编码)(转载)
本文介绍了字符串编码的发展历程,从ASCII、GB2312到Unicode和UTF-8,详细解释了各种编码的特点和应用场景,重点阐述了解决多语言乱码问题的演变过程。
87 54
|
JavaScript 前端开发 Java
Unicode转义(\uXXXX)的编码和解码
  在涉及Web前端开发时, 有时会遇到\uXXXX格式表示的字符, 其中XXXX是16进制数字的字符串表示形式, 在js中这个叫Unicode转义字符, 和\n \r同属于转义字符. 在其他语言中也有类似的, 可能还有其它变形的格式.
2645 0
|
7月前
|
自然语言处理 Python
Python 中的编码与解码字符集与 Unicode 的详解
【6月更文挑战第10天】Python编程中,理解字符编码(如ASCII、UTF-8)和Unicode至关重要,它们关乎文本数据的正确处理。编码是字符转字节,解码则相反。UTF-8能表示几乎所有字符,适合多语言。Unicode为全球字符提供唯一编码。处理不同源文本时,需注意编码一致性,否则可能产生乱码。Python支持Unicode,但错误的编码解码操作可能导致问题。要确保程序处理文本的正确性,需选合适编码方案并保持编码一致性。
98 0
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
编码和解码的未来之路
编码和解码的未来之路
|
iOS开发
Unicode 与 UTF-8 编码的转换
Unicode 与 UTF-8 编码的转换
Unicode 与 UTF-8 编码的转换
|
Web App开发 存储 Windows
字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
转自:  http://apps.hi.baidu.com/share/detail/17798660 字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得字符编码的知识。不注意的人可能对这个不在意,但这些名词有时候实在让人迷惑,对想学习计算机知识的人来说,搞懂它也十分重要,我也是在学习中慢慢了解了一些这方面的知识。
1924 0
|
存储 算法 Java
【字符编码】字符编码 && Base64编码算法
  在前面的解决乱码的一文中,只找到了解决办法,但是没有为什么,说白了,就是对编码还是不是太熟悉,编码问题是一个很简单的问题,计算机从业人员应该也必须弄清楚,基于编码的应用有Base64加密算法,然后,这个问题一直放着,想找个机会解决。于是乎,终于逮到机会,开始下手。
256 0
【字符编码】字符编码 && Base64编码算法

热门文章

最新文章

下一篇
开通oss服务