谈谈Deepgreen(Greenplum)中文编码

简介: 很多国内客户对中文编码要求比较苛刻,今天我们来聊聊中文编码问题。 概念 Deepgreen和Greenplum是基于PostgreSQL 8.2版本。 PostgreSQL 8.2能够以各种字符集存储文本,比如 ISO-8859 系列和 EUC(扩展 Unix 编码)、UTF-8 、Mule 国际编码。

timg_jpeg

很多国内客户对中文编码要求比较苛刻,今天我们来聊聊中文编码问题。

概念

  • Deepgreen和Greenplum是基于PostgreSQL 8.2版本。
  • PostgreSQL 8.2能够以各种字符集存储文本,比如 ISO-8859 系列和 EUC(扩展 Unix 编码)、UTF-8 、Mule 国际编码。缺省的字符集是在使用 initdb 初始化数据库集群的时候选择的。在你创建数据库的时候是可以覆盖这个缺省的。因此,你可以有多个数据库,每个都有不同的字符集。
  • PostgreSQL 8.2只支持以UTF-8的形式存储中文,不支持GBK等标准国标编码。这也就从源头上限制了Deepgreen和Greenplum只能通过UTF-8的方式支持中文。

比较

  • UTF-8作为一种全国家通用的编码,可以完全表示GBK字符,包括生僻字。所以在范围上,UTF-8更有优势,因为不仅可以表示中文,还可以表示英文等其他语言。建议在存储语言不固定时,选择UTF-8更为稳妥。
  • GBK作为中文编码,在大篇幅表示中文时,会非常节省空间,所以如果项目中大部分都是中文,英文极少,可以选择GBK。
目录
相关文章
|
存储 C++
基于C++的简易文件压缩与解压缩工具设计与实现
基于C++的简易文件压缩与解压缩工具设计与实现
713 3
|
6月前
|
存储 人工智能 分布式计算
数据不用搬,AI直接炼!阿里云AnalyticDB AI数据湖仓一站式融合AI+BI
阿里云瑶池旗下的云原生数据仓库AnalyticDB MySQL版(以下简称ADB)诞生于高性能实时数仓时代,实现了PB级结构化数据的高效处理和分析。在前几年,为拥抱大数据的浪潮,ADB从传统数仓拓展到数据湖仓,支持Paimon/Iceberg/Delta Lake/Hudi湖格式,为开放的数据湖提供数据库级别的性能、可靠性和管理能力,从而更好地服务以SQL为核心的大规模数据处理和BI分析,奠定了坚实的湖仓一体基础。
|
9月前
|
Java
IDEA修改JDK版本
在IDEA中修改项目JDK版本的方法如下:1. 右键点击项目;2. 选择“Open Module Settings”,如图所示;3. 在弹出窗口中配置自定义的JDK路径。通过以上步骤,可轻松更改项目所使用的JDK版本,满足不同开发环境的需求。
2811 65
|
运维 Oracle 关系型数据库
screw生成数据库文档
screw生成数据库文档
384 12
|
安全 关系型数据库 MySQL
【赵渝强老师】MySQL的连接方式
本文介绍了MySQL数据库服务器启动后的三种连接方式:本地连接、远程连接和安全连接。详细步骤包括使用root用户登录、修改密码、创建新用户、授权及配置SSL等。并附有视频讲解,帮助读者更好地理解和操作。
1216 1
|
关系型数据库 MySQL 开发工具
MySQL双主复制
MySQL双主复制
431 0
|
机器学习/深度学习 PyTorch TensorFlow
【机器学习】基于tensorflow实现你的第一个DNN网络
【机器学习】基于tensorflow实现你的第一个DNN网络
341 0
|
存储 安全 编译器
【C++ 多态 】深入理解C++的运行时类型信息(RTTI):dynamic_cast和typeid的应用与原理
【C++ 多态 】深入理解C++的运行时类型信息(RTTI):dynamic_cast和typeid的应用与原理
1518 1
|
人工智能 Oracle jenkins
【Jenkins】新手安装、运行Jenkins(详细教学)
【Jenkins】新手安装、运行Jenkins(详细教学)
|
网络安全
socks5代理连接成功无法访问http协议的站点
无法通过SOCKS5代理访问HTTP网站可能由多个原因引起,如代理服务器不支持HTTP、配置错误、防火墙阻拦、连接问题、身份验证失败、浏览器设置不当或服务器被封锁。检查并解决这些因素,若问题持续,需深入排查或联系服务提供商。

热门文章

最新文章