谈谈Deepgreen(Greenplum)中文编码

简介: 很多国内客户对中文编码要求比较苛刻,今天我们来聊聊中文编码问题。 概念 Deepgreen和Greenplum是基于PostgreSQL 8.2版本。 PostgreSQL 8.2能够以各种字符集存储文本,比如 ISO-8859 系列和 EUC(扩展 Unix 编码)、UTF-8 、Mule 国际编码。

timg_jpeg

很多国内客户对中文编码要求比较苛刻,今天我们来聊聊中文编码问题。

概念

  • Deepgreen和Greenplum是基于PostgreSQL 8.2版本。
  • PostgreSQL 8.2能够以各种字符集存储文本,比如 ISO-8859 系列和 EUC(扩展 Unix 编码)、UTF-8 、Mule 国际编码。缺省的字符集是在使用 initdb 初始化数据库集群的时候选择的。在你创建数据库的时候是可以覆盖这个缺省的。因此,你可以有多个数据库,每个都有不同的字符集。
  • PostgreSQL 8.2只支持以UTF-8的形式存储中文,不支持GBK等标准国标编码。这也就从源头上限制了Deepgreen和Greenplum只能通过UTF-8的方式支持中文。

比较

  • UTF-8作为一种全国家通用的编码,可以完全表示GBK字符,包括生僻字。所以在范围上,UTF-8更有优势,因为不仅可以表示中文,还可以表示英文等其他语言。建议在存储语言不固定时,选择UTF-8更为稳妥。
  • GBK作为中文编码,在大篇幅表示中文时,会非常节省空间,所以如果项目中大部分都是中文,英文极少,可以选择GBK。
目录
相关文章
|
7月前
|
存储 关系型数据库 MySQL
MySQL分区表:万字详解与实践指南
MySQL分区表:万字详解与实践指南
|
8月前
|
缓存 关系型数据库 MySQL
史上最全MySQL 大表优化方案(长文)
史上最全MySQL 大表优化方案(长文)
1624 0
|
存储 关系型数据库 MySQL
高性能 MySQL(十二):分区表
分区表是一个独立的逻辑表,其底层由多个物理子表组成。对分区表的请求,在 MySQL 底层都会被转换为对范围内的物理子表的请求,并将结果合并到一起返回。
148 0
|
存储 SQL 缓存
15天学习MySQL计划-数据库引擎(进阶篇)第六天
15天学习MySQL计划-数据库引擎(进阶篇)第六天
97 0
|
关系型数据库 测试技术
mysqlpump和mysqldump的性能大比拼(r12笔记第90天)
昨天测试了一下mysqlpump,今天来把剩下的补充完成,算是一个小的系列。 mysqlpump 在MySQL 5.7中做逻辑备份恢复有了一个新的工具mysqlpump,如果你掌握了mysqldump,那么使用mysqlpump就是分分钟的事情,因为很多参数都是很相似的,可以理解它是mysqldump的加强版,一个亮点就是有了并行的选项,使得数据备份的性能更加强大。
2362 0
|
Oracle 关系型数据库 分布式数据库
Oracle学习(十五):分布式数据库
本文主要讲Oracle分布式数据库
925 0
Oracle学习(十五):分布式数据库
|
SQL 存储 缓存
MySQL 大表优化方案(长文)
单表优化 除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下,字符串为主的表在五百万以下是没有太大问题的。而事实上很多时候My
MySQL 大表优化方案(长文)
|
存储 SQL 负载均衡
OceanBase 源码解读(三):分区的一生
源码是OceanBase的“方向盘”,本系列主要围绕“源码解读”,通过文章阐述,帮助大家理清数据库的内在本质。此前,带你读源码第二篇《戳这里回顾:OceanBase源码解读(二):SQL的一生》为大家介绍了OceanBase 数据库中一条 SQL 的执行流程主路径,包括接收、处理、返回结果给客户端的过程,探讨了OceanBase的SQL引擎模块。
370 0
|
SQL 缓存 多模数据库
OceanBase源码解读(二):SQL的一生
本文为 OceanBase 数据库源码解读系列文章的第二篇,将主要为大家介绍 OceanBase 数据库中一条 SQL 的执行流程主路径,包括接收、处理、返回结果给客户端的过程,与开发者们一起探讨OceanBase的SQL引擎模块。
OceanBase源码解读(二):SQL的一生
|
关系型数据库 MySQL 数据库
互联网公司为啥不使用mysql分区表?(一分钟系列)
有个朋友问我分区表在58的应用,我回答不出来,在我印象中,百度、58都没有听说有分区表相关的应用,业内进行一些技术交流的时候也更多的是自己分库分表,而不是使用分区表。于是去网上查了一下,并询问了58到家的DBA专家,将自己收到的信息沉淀下来,share给大伙。
1711 0