谈谈Deepgreen(Greenplum)中文编码

简介: 很多国内客户对中文编码要求比较苛刻,今天我们来聊聊中文编码问题。 概念 Deepgreen和Greenplum是基于PostgreSQL 8.2版本。 PostgreSQL 8.2能够以各种字符集存储文本,比如 ISO-8859 系列和 EUC(扩展 Unix 编码)、UTF-8 、Mule 国际编码。

timg_jpeg

很多国内客户对中文编码要求比较苛刻,今天我们来聊聊中文编码问题。

概念

  • Deepgreen和Greenplum是基于PostgreSQL 8.2版本。
  • PostgreSQL 8.2能够以各种字符集存储文本,比如 ISO-8859 系列和 EUC(扩展 Unix 编码)、UTF-8 、Mule 国际编码。缺省的字符集是在使用 initdb 初始化数据库集群的时候选择的。在你创建数据库的时候是可以覆盖这个缺省的。因此,你可以有多个数据库,每个都有不同的字符集。
  • PostgreSQL 8.2只支持以UTF-8的形式存储中文,不支持GBK等标准国标编码。这也就从源头上限制了Deepgreen和Greenplum只能通过UTF-8的方式支持中文。

比较

  • UTF-8作为一种全国家通用的编码,可以完全表示GBK字符,包括生僻字。所以在范围上,UTF-8更有优势,因为不仅可以表示中文,还可以表示英文等其他语言。建议在存储语言不固定时,选择UTF-8更为稳妥。
  • GBK作为中文编码,在大篇幅表示中文时,会非常节省空间,所以如果项目中大部分都是中文,英文极少,可以选择GBK。
目录
相关文章
|
3月前
|
SQL 缓存 关系型数据库
(二)全解MySQL:一条SQL语句从诞生至结束的多姿多彩历程!
在上篇文章中,我们以《MySQL架构篇》拉开了MySQL数据库的的序幕,上篇文章中将MySQL分层架构中的每一层都进行了详细阐述。而在本篇中,则会进一步站在一条SQL的角度,从SQL的诞生开始,到SQL执行、数据返回等全链路进行分析。
115 1
|
3月前
|
分布式数据库 索引
Greenplum实用技巧
以上是一些基本的Greenplum实用技巧,希望对你有所帮助。
29 1
|
4月前
|
存储 关系型数据库 MySQL
MySQL分区表:万字详解与实践指南
MySQL分区表:万字详解与实践指南
|
5月前
|
关系型数据库 C# 数据库
2023 年度数据库 PostgreSQL 遇到年度编程语言 C# 会发生什么样的火花?
2023 年度数据库 PostgreSQL 遇到年度编程语言 C# 会发生什么样的火花?分析这俩的发展趋势,技术生态,社区活跃度,特别是国产化信创领域的支持度?
81 1
|
存储 SQL 缓存
15天学习MySQL计划-数据库引擎(进阶篇)第六天
15天学习MySQL计划-数据库引擎(进阶篇)第六天
91 0
|
Oracle 关系型数据库 MySQL
|
SQL 关系型数据库 MySQL
【大数据系列之MySQL】(三十):MySQL中的DDL语言
【大数据系列之MySQL】(三十):MySQL中的DDL语言
121 0
|
Oracle 网络协议 关系型数据库
PostgreSQL(PPAS 兼容Oracle) 从零开始入门手册 - 珍藏版
标签 PostgreSQL , edb , ppas , Oracle 兼容 背景 云数据库PPAS版,是阿里云与EnterpriseDB公司(简称EDB)合作基于PostgreSQL高度兼容Oracle语法的数据库服务,为用户提供易于操作的迁移工具,兼容范围涵盖:PL/SQL、数据类型、高级函数、表分区等。
4543 0