Java日常开发代码优化
缘由
不积跬步无以至千里,不积小流无以成江河。如果说考虑的工期等因素,代码能按期正常无bug运行上线就算项目完成,如果想让项目运行的更流程,用户体验更好,必要的代码细节还是需要仔细考虑的,每次优化一点点,日积月累的优化也是会有质的改变的。
优化
1.尽量重用对象
特别是 String 对象的使用,出现字符串连接时应该使用 StringBuilder/StringBuffer 代替。由于 Java 虚拟机不仅要花时间生成对象,以后可能还需要花时间对这些对象进行垃圾回收和处理,因此,生成过多的对象将会给程序的性能带来很大的影响。
2.尽可能使用局部变量
调用方法时传递的参数以及在调用中创建的临时变量都保存在栈中速度较快,其他变量,如静态变量、实例变量等,都在堆中创建,速度较慢。另外,栈中创建的变量,随着方法的运行结束,这些内容就没了,不需要额外的垃圾回收。
3.及时关闭流
Java 编程过程中,进行数据库连接、I/O 流操作时务必小心,在使用完毕后,及时关闭以释放资源。因为对这些大对象的操作会造成系统大的开销,稍有不慎,将会导致严重的后果。
4.尽量减少对变量的重复计算
明确一个概念,对方法的调用,即使方法中只有一句语句,也是有消耗的,包括创建栈帧、调用方法时保护现场、调用方法完毕时恢复现场等。
这样的话每一次遍历都需要进行一次dataList.size()操作,可以更换为:
5.尽量采用懒加载的策略,即在需要的时候才创建
可以替换成:
这样操作的话就是等真的需要用到这个参数了再加载获取,如果用不到的话就获取,其实是没有意义的。
6.慎用异常
异常对性能不利。抛出异常首先要创建一个新的对象,
Throwable 接口的构造函数调用名为 fillInStackTrace() 的本地同步方法,
fillInStackTrace() 方法检查堆栈,收集调用跟踪信息。
只要有异常被抛出,Java 虚拟机就必须调整调用堆栈,因为在处理过程中创建了一个新的对象。
异常只能用于错误处理,不应该用来控制程序流程。
7.不要在循环中使用try…catch…,应该把其放在最外层
8.如果能估计到待添加的内容长度,为底层以数组方式实现的集合、工具类指定初始长度
比如 ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等等,以 StringBuilder 为例:
StringBuilder() // 默认分配16个字符的空间,(父类AbstractStringBuilder)
StringBuilder(int size) // 默认分配size个字符的空间
StringBuilder(String str) // 默认分配16个字符+str.length()个字符空间
可以通过类(这里指的不仅仅是上面的 StringBuilder)的来设定它的初始化容量,这样可以明显地提升性能。比如 StringBuilder吧,length 表示当前的 StringBuilder 能保持的字符数量。因为当 StringBuilder 达到最大容量的时候,它会将自身容量增加到当前的2倍再加2,
无论何时只要 StringBuilder 达到它的最大容量,它就不得不创建一个新的字符数组然后将旧的字符数组内容拷贝到新字符数组中—-这是十分耗费性能的一个操作。试想,如果能预估到字符数组中大概要存放5000个字符而不指定长度,最接近5000的2次幂是4096,每次扩容加的2不管,那么:
在4096 的基础上,再申请8194个大小的字符数组,加起来相当于一次申请了12290个大小的字符数组,如果一开始能指定5000个大小的字符数组,就节省了一倍以上的空间;
把原来的4096个字符拷贝到新的的字符数组中去。
这样,既浪费内存空间又降低代码运行效率。所以,给底层以数组实现的集合、工具类设置一个合理的初始化容量是错不了的,这会带来立竿见影的效果。但是,注意,像 HashMap 这种是以数组+链表实现的集合,别把初始大小和你估计的大小设置得一样,因为一个 table 上只连接一个对象的可能性几乎为0。初始大小建议设置为2的N次幂,如果能估计到有2000个元素,设置成 new HashMap(128)、new HashMap(256) 都可以。
9.当复制大量数据时,使用System.arraycopy()命令(目前遇到的业务上未用到大量复制数据操作)
10.乘法和除法使用移位操作
执行结果:
11.循环内不要不断创建对象引用
这样做的话会导致内存中有size份对象的引用,当size很大的时候,就比较耗费内存。
可以替换为:
这样改之后的话内存中只有一份对象引用,每次new的时候,只是对象引用指向不同的对象,但是内存中只有一份,这样也就节省了内存空间。
12.尽量使用HashMap、ArrayList、StringBuilder,除非线程安全需要,否则不推荐使用Hashtable、Vector、StringBuffer,后三者由于使用同步机制而导致了性能开销。
13.尽量避免随意使用静态变量
要知道,当某个对象被定义为 static 的变量所引用,那么 GC 通常是不会回收这个对象所占有的堆内存的。
14.对资源的close()建议分开操作
可以修改为:
这样做的益处是如果in.close();执行时发生异常那么也不影响out.close();的执行,第一种的话如果in.close发生异常,则out.close将永远不会执行,就会一直占用资源。
15.使用最有效率的方式去遍历Map
遍历Map的方式很多,通常场景下我们需要获取map的key和value值,推荐的方式如下:
如果只是想遍历一下map的key值,那么可以用map.keySet();获取key值集合后遍历取值。
16.把一个基本数据类型转为字符串,obj.toString()是最快的方式、String.valueOf(obj)次之、obj+“”最慢,下面我们来看一下为什么这么说,首先看String.valueOf(obj):
可以看到String.valueOf(obj)内部还是obj.toString(),同时增加了null判断;
obj+“”,底层使用了 StringBuilder 实现,先用 append() 方法拼接,再用 toString() 方法获取字符串。
17.公用的集合类中不使用的数据一定要及时remove掉
如果一个集合类是公用的(也就是说不是方法里面的属性),那么这个集合里面的元素是不会自动释放的,因为始终有引用指向它们。所以,如果公用集合里面的某些数据不使用而不去 remove 掉它们,那么将会造成这个公用集合不断增大,使得系统有内存泄露的隐患。
18.不要对超出范围的基本数据类型做向下强制转型
public static void main(String[] args) { long a = 123456789123456L; System.out.println("long="+a); int b = (int) a; System.out.println("int="+b); }
执行结果:
long=123456789123456 int=-2045800064
强转之后得到的结果并不是我们想要的结果,这是因为a值已经超出int的范围。
19.不要对数组使用toString()方法
对数组用toString方法没有意义
public static void main(String[] args) { String[] a = new String[]{"nihao","java","php"}; System.out.println(a.toString()); }
执行结果:
[Ljava.lang.String;@67f89fa3
想要获取具体某个值时可以通过System.out.println(a[0]);角标获取。
20.在java中if(i == 1) 和 if(1 == i)是没有区别的,但从阅读习惯上讲,建议使用前者。
21.字符串变量和字符串常量equals的时候将字符串常量写在前面
public static void main(String[] args) { String a = "nihao"; if ("nihao".equals(a)) { System.out.println("相同"); } }
22.不要让public方法中有太多的形参,太多形参的话一方面看起来比较low,另一方面就是别人调用的时候容易搞乱参数对应位置导致出错,针对于多参数的时候可以自定义对象传参或者封装map传参均可以。
23.顺序插入和随机访问比较多的场景使用ArrayList,元素删除和中间插入比较多的场景使用LinkedList这个。
24.使用带缓冲的输入输出流进行IO操作,带缓冲的输入输出流,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,这可以极大地提升 IO 效率。
25.使用数据库连接池和线程池
这两个池都是用于重用对象的,前者可以避免频繁地打开和关闭连接,后者可以避免频繁地创建和销毁线程。
26.不要创建一些不使用的对象,不要导入一些不使用的类
这毫无意义,如果代码中出现“The value of the local variable i is not used”、“The import java.util is never used”,那么请删除这些无用的内容。
27.将常量声明为static final,并以大写命名
这样在编译期间就可以把这些内容放入常量池中,避免运行期间计算生成常量的值。另外,将常量的名字以大写命名也可以方便区分出常量与变量。
28.使用同步代码块替代同步方法
这点在多线程模块中的 synchronized 锁方法块一文中已经讲得很清楚了,除非能确定一整个方法都是需要进行同步的,否则尽量使用同步代码块,避免对那些不需要进行同步的代码也进行了同步,影响了代码执行效率。
29.实现RandomAccess接口的集合比如ArrayList,应当使用最普通的for循环而不是foreach循环来遍历
官方解释:Marker interface used by List implementations to indicate that they support fast (generally constant time) random access. The primary purpose of this interface is to allow generic algorithms to alter their behavior to provide good performance when applied to either random or sequential access lists.
The best algorithms for manipulating random access lists (such as ArrayList) can produce quadratic behavior when applied to sequential access lists (such as LinkedList). Generic list algorithms are encouraged to check whether the given list is an instanceof this interface before applying an algorithm that would provide poor performance if it were applied to a sequential access list, and to alter their behavior if necessary to guarantee acceptable performance.
It is recognized that the distinction between random and sequential access is often fuzzy. For example, some List implementations provide asymptotically linear access times if they get huge, but constant access times in practice. Such a List implementation should generally implement this interface. As a rule of thumb, a List implementation should implement this interface if,for typical instances of the class, this loop:
for (int i=0, n=list.size(); i < n; i++)
list.get(i);
runs faster than this loop:
for (Iterator i=list.iterator(); i.hasNext(); )
i.next();
百度翻译:
列表实现使用的标记接口,用于指示它们支持快速(通常为固定时间)随机访问。此接口的主要目的是允许通用算法在应用于随机或顺序访问列表时改变其行为,以提供良好的性能。
操作随机访问列表的最佳算法(如ArrayList)在应用于顺序访问列表(如LinkedList)时会产生二次行为。鼓励通用列表算法在应用算法之前检查给定列表是否为该接口的实例,如果将该算法应用于顺序访问列表,则该算法将提供较差的性能,并在必要时改变其行为,以确保可接受的性能。
人们认识到,随机存取和顺序存取之间的区别通常是模糊的。例如,一些List实现提供了渐近线性的访问时间,如果它们的访问时间很大,但实际上是恒定的。这种列表实现通常应实现此接口。根据经验,如果对于类的典型实例,此循环。。。
实际经验表明,实现 RandomAccess 接口的类实例,假如是随机访问的,使用普通 for 循环效率将高于使用 foreach 循环;反过来,如果是顺序访问的,则使用 Iterator 会效率更高。