南大通用 GBase 8s JDBC字符集参数详解-阿里云开发者社区

南大通用 GBase 8s JDBC字符集参数详解

2024-11-28 702

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

PolarDB Agent Express，2核4GB

PolarDB Agent Flow，2核4GB

PolarSearch，搜索节点 4核8GB

简介： 本文详细介绍了南大通用GBase 8s V8.8 数据中四个关键的JDBC字符集参数：CLIENT_LOCALE、DB_LOCALE、NEWCODESET和NEWLOCALE，涵盖它们的功能、配置方法及其在数据库操作中的作用，旨在帮助开发者和数据库管理员提升数据处理的效率与准确性。

在数据库应用开发中，字符集的正确配置对于数据的准确存储和检索至关重要。南大通用 GBase 8s V8.8提供了多种JDBC字符集参数来优化字符处理。本文将详细介绍包括CLIENT_LOCALE、DB_LOCALE、NEWCODESET和NEWLOCALE 这4个参数，帮助开发者和数据库管理员更好地理解和应用这些参数，以提高数据库操作的效率和准确性。

一、CLIENT_LOCALE参数详解
CLIENT_LOCALE参数决定了客户端字符集的设置，影响错误消息的语言、日期时间格式等。

如zh_CN.utf8，以“.”分割的左右两部分。

左边决定：

1、抛异常时，报错信息中文还是英文

zh_CN：中文（JDBC 3.3.0版本及以前不支持）

en_US：英文

注意，这个功能需要server支持，不是所有字符集都可以修改左边的部分。

2、一些时间日期格式

java.sql.Date/java.sql.Time/java.sql.Timestamp转str，等等一些时间日期格式处理。

右边决定：

客户端这边字符集

例如，char类型的列，rs.getBytes时，用这个字符集编码。

例如，clob类型的列，ps.setBinaryStream时，用这个字符集编码。

二、DB_LOCALE参数的重要性
DB_LOCALE参数用于定义数据库字符集，确保数据在发送到服务器之前正确编码，并在从服务器检索时正确解码。

同上，也是以“.”分割的左右两部分。

左边一般用不到

右边决定：（主要是以下3种用途）

字符发给server前要经过编码，以它为字符集编码

从server取回字节数组，需要解码为字符时，以它为字符集解码

最常见的执行sql，就是先用这个字符集编码

建出来database的字符集
三、NEWCODESET参数的应用
NEWCODESET参数允许将GBase编码名称映射到JDK编码名称，提供了字符集映射的灵活性。

URL上可以写多组，以“:”分割。

每组内以“,”分割，必须有3个元素。

用途：

1、把gbase编码名或数字映射到jdk的编码名
如果url有NEWCODESET=GB18030,GB18030-2000,5488

第1个元素：GB18030（jdkEnc）

第2个元素：GB18030-2000（gbaseEncName）

第3个元素：5488（gbaseEncNumber）

当写

DB_LOACLE=zh_CN.GB18030-2000;CLIENT_LOCALE=zh_CN.GB18030-2000;
或

DB_LOCALE=zh_CN.5488;CLIENT_LOCALE=zh_CN.5488
驱动中编解码时使用的是被映射后的jdk编码名GB18030

2、映射成其他字符集
例如，

DB_LOCALE=en_US.819;CLIENT_LOCALE=en_US.819;NEWCODESET=UTF-8,cp1252,819
由于DB_LOCALE=en_US.819，所以建出来的database字符集是819，但是它能用来存取UTF-8的字符。

由于NEWCODESET=UTF-8,cp1252,819，编码前会把819映射为UTF-8，比如汉字字符用UTF-8进行编码，一般常见的汉字编码为3个字节，可以理解为对应819的3个字符，存到database中。查询时，从结果集取出来，用UTF-8解码。

当DB_LOCALE和CLIENT_LOCALE的右半部分指定的字符集不是819或cp1252时，那么不会进行任何映射，NEWCODESET参数无效。

映射逻辑：

看编码字符串，是否是NEWCODESET的第2个元素（gbase编码名），如果是，映射成第1个元素，结束，否则2。

看编码字符串，是否是驱动内置HashTable（假设名字是table1）的某一个key，如果是，映射成value，结束，否则3。

看编码字符串，是否是NEWCODESET的第3个元素（gbase编码数字），如果是，映射成第1个元素，结束，否则4。

看编码字符串，是否是内置HashTable（假设名字是table2）的某一个key，如果是映射成value，结束

table1 = new Hashtable();
table1.put(“88859-1”, “ISO8859_1”);
……
table1.put(“utf8”,”UTF8”);
table1.put(“GB18030”,”GB18030”);
table2 = new Hashtable();
table2.put(“819”,”ISO8859_1”);
……
table2.put(“57372”,”UTF8”);
table2.put(“5488”,”GB18030”);
4、NEWLOCALE参数的用法
NEWLOCALE参数用于映射客户端和数据库的区域设置，NEWCODESET映射的是CLIENT_LOCALE和DB_LOCALE的右边，NEWLOCALE映射左边。这个参数用的比较少，这里不做过多介绍。

通过本文的详细介绍，您应能了解GBase 8s中JDBC字符集参数的配置和应用。我们希望本文能帮助您在实际工作中更有效地管理字符集，优化数据库操作。感谢您的阅读。

南大通用 GBase 8s JDBC字符集参数详解

数据库

热门文章

最新文章

相关课程

相关电子书