一前言:
以前刚开始用java连接mysql时,都是连猜带蒙的。比如:
一个Statement,Connection何时关闭?
Connection能不能先于Statement关闭?
ResultSet是怎样存放数据的?怎样才能高效操纵ResultSet?
PrepareStatement到底是怎样回事?
连接池是怎样工作的?
二、从JDBC driver代码分析:
在性能要求高的地方,应当使用ResultSet.get**(int)系列函数
如ResultSet.getBytes(String columnName),
则会先会调用findColumn(columnName)去查找到columnName对应的index是什么,而在findColumn(columnName)函数中,
会检查索引有没有构建好了,如果还没有则要构建columnName对应的索引。
所以,如果对性能要求,则应该使用ResultSet.getBytes(int column)函数。
PreparedStatement的缓存及重用
对于PreparedStatement,会有一个LRUCache来存放,会先到里面去取,拿不到再创建一个新的。
这个LRUCache的默认大小是25(太小了吧。。)。对于sql长度,如果大于256的,貌似则不缓存这个PreparedStatement。
LRUCache很简单,代码:
public class LRUCache extends LinkedHashMap {
protected int maxElements;
public LRUCache(int maxSize) {
super(maxSize);
this.maxElements = maxSize;
}
protected boolean removeEldestEntry(Entry eldest) {
return (size() > this.maxElements);
}
}
LinkedHashMap在每次put和putAll后,会调用removeEldestEntry来判断是否要移除最老的Entry。
LinkedHashMap的实现也比较简单,里面用双向链表把所有的Entry串在一起,当调用get时,把get所在的key移到链表的最前面。
PreparedStatement是如何实现重用的:
pStmt = (com.mysql.jdbc.ServerPreparedStatement)this.serverSideStatementCache.remove(sql);
if (pStmt != null) {
((com.mysql.jdbc.ServerPreparedStatement)pStmt).setClosed(false);
pStmt.clearParameters();
}
可见只是设置未关闭,再清除Parameters。所以从代码上来说,我们得到一个PreparedStatement在使用后,可以调用clearParameters,再接着使用。但是最好不要这样做。
如果是想要执行多次,可以用addBatch和executeBatch函数来多次执行。
关于CallableStatement和ServerPreparedStatement
CallableStatement,ServerPreparedStatement继承自PreparedStatement,实际上prepareStatement(String sql)函数返回的就是ServerPreparedStatement,LRUCache中放的也是。
CallableStatement也有一个LRUcache。
实际上当PreparedStatement调用close时,并没有真正释放掉资源,
Statement、Connection、ResultSet何时close
查看Statement的close函数代码,可以发现当close时,这个Statement中所有的ResultSet也会被close。
查看Connection的close函数,当close时,这个Connection的所有Statement都会被close。
但是据JDBC4的规范,有可能当Statement关闭时,ResultSet中的资源未被完全释放,当GC再次运行时才会回收。
所以最好就是顺序关闭ResultSet,Statement,Connection。
异常处理
SQLException是可以迭代的,应该用以下的代码来处理所有的异常:
catch(SQLException ex) {
while(ex != null) {
System.out.println("SQLState:" + ex.getSQLState());
System.out.println("Error Code:" + ex.getErrorCode());
System.out.println("Message:" + ex.getMessage());
Throwable t = ex.getCause();
while(t != null) {
System.out.println("Cause:" + t);
t = t.getCause();
}
ex = ex.getNextException();
}
}
//或者
catch(SQLException ex) {
for(Throwable e : ex ) {
System.out.println("Error encountered: " + e);
}
}
在代码Connection类的很多地方,比如void closeAllOpenStatements()函数,可以看到这样的代码:
for (int i = 0; i < numStmts; i++) {
Statement stmt = (Statement) currentlyOpenStatements.get(i);
try {
stmt.realClose(false, true);
} catch (SQLException sqlEx) {
postponedException = sqlEx; // throw it later, cleanup all
// statements first
}
}
感觉这个是有问题的,因为把一些异常信息给丢掉了,实际上是可以迭代的,应该调用setNextException函数把异常都加到一起。
统计数量count:
stmt.execute(sql);
ResultSet resultSet = stmt.getResultSet();
resultSet.next();
int count = resultSet.getInt("count(*)");//or getInt(1);
代码中其它一些有意思的地方:
在代码中有大量的StringBuffer,而没有用StringBuilder,可能是要兼容JDK5的原因
配置都用一个ConnectionProperty类来表示,从这里派生出子类,IntegerConnectionProperty,BooleanConnectionProperty什么的。
每一个配置有都默认值,描述信息,版本等。貌似大部分在ConnectionProperties类中实现。
发现了代码中的一个bug,没有找到找交的地方,不是很重要就算了:)
com.mysql.jdbc.ConnectionProperties类initializeFrom(String extractedValue)函数中:
if (extractedValue.endsWith("k")
|| extractedValue.endsWith("K")
|| extractedValue.endsWith("kb")
|| extractedValue.endsWith("Kb")
|| extractedValue.endsWith("kB")) {
multiplier = 1024;
int indexOfK = StringUtils.indexOfIgnoreCase(
extractedValue, "k");
extractedValue = extractedValue.substring(0, indexOfK);
} else if (extractedValue.endsWith("m")
|| extractedValue.endsWith("M")
|| extractedValue.endsWith("G") //这行明显是多出来的
|| extractedValue.endsWith("mb")
|| extractedValue.endsWith("Mb")
|| extractedValue.endsWith("mB")) {
multiplier = 1024 * 1024;
三、从JDBC规范来看:
类型对照表:
Java类型 |
SQL类型 |
boolean |
BIT |
byte |
TINYINT |
short |
SMALLINT |
int |
INTEGER |
long |
BIGINT |
float |
FLOAT |
double |
DOUBLE |
byte[] |
BINARY、VARBINARY、LONGBINARY |
java.lang.String |
CHAR、VARCHAR、LONGVARCHAR |
java.math.BigDecimal |
NUMERIC、DECIMAL |
java.sql.Date |
DATE |
java.sql.Time |
TIME |
java.sql.Timestamp |
TIMESTAMP |
注意:
在JDBC中要表示日期,是使用java.sql.Date,其日期格式是"年、月、日";
要表示时间的话则是使用java.sql.Time,其时间格式为"时、分、秒";
如果要表示"时、分、秒、微秒"的格式,则是使用java.sql.Timestamp
连接池可能会自动关闭之前的connection!
要注意使用连接池时,据JDBC规范:
A single physical PooledConnection object may generate many logical
Connection objects during its lifetime. For a given PooledConnection object,
only the most recently produced logical Connection object will be valid. Any
previously existing Connection object is automatically closed when the associated
PooledConnection.getConnection method is called. Listeners (connection
pool managers) are not notified in this case.
This gives the application server a way to take a connection away from a client.
This is an unlikely scenario but may be useful if the application server is trying
to force an orderly shutdown.
所以之前得到的Connection有可能会失效!!
但是实际上我估计没人会按这个方案来实现,因为太不友好,怎么能别人用着你就把它悄悄地关闭掉了。
测试了proxool,当设置最大Connection数为1时,在获取第二个Connection时,会抛出个异常。
物理连接和逻辑连接
连接池中分为物理连接和逻辑连接,对应PooledConnection类和Connection类。
PooledConnection不对用户暴露,当PooledConnection调用close时才关闭物理连接。
当Connection调用close时,并不真正关闭物理连接,只是把它放入池中。
Statement
Statement也分两种logical statement和physical statement。
可以实现PreparedStatement池,当Connection调用close时,并不把PreparedStatement关闭,有可能是放入到池中。
A pool of statements is associated with a PooledConnection object.
所以说一个物理连接都有一个Statement池。至于池的大小,可以通过ConnectionPoolDataSource的Properties来设置。
ConnectionPoolDataSource的属性
ConnectionPoolDataSource 有以下的标准属性:
maxStatements,initialPoolSize,minPoolSize,maxPoolSize,maxIdleTime,propertyCycle。