基本概念
我们一般理解java中
一个字符char占2个字节byte
一个汉字占2个字节byte
一个字母占1个字节byte
其他情况
对于汉字来说,采用gbk编码占两字节,采用utf8编码占三个字节。
String的length()方法
String s1 = "aa";
String s2 = "a好";
s1.length()
s2.length()
答案都是2,因为该方法是返回字符的个数,并不是内存中的字节数。
数据库应用
java的编码不会影响数据库对汉字或者字母所占内存的理解。
数据库中一个字段长度为varchar(50),表明在内存中占50个字节,所以我们一般认为可以输入25个汉字,50个字母。
如果该内容即可以是汉字,也可以是字母,我们在后台验证的时候一般减半处理。
if(name.length()<25){ }
当然也可以判断如果是汉字,长度加1。
本文转自IT徐胖子的专栏博客51CTO博客,原文链接http://blog.51cto.com/woshixy/973116如需转载请自行联系原作者
woshixuye111