PostgreSQL Oracle 兼容性之 - COMPOSE , UNISTR , DECOMPOSE

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云数据库 RDS SQL Server,基础系列 2核4GB
简介:

背景

参考
http://www.th7.cn/db/Oracle/2011-06-30/8490.shtml

很多语言,包括英语在内,都使用沉音字符(accented character)。

因为这些字符不属于 ASCII 字符集,所以假如不查看 Unicode 值也不使用 Unicode 编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。

Oracle9i 引入了 COMPOSE 函数,该函数接受一串 Unicode 字符并规则化其文本。

这就意味着它可以接受一个字母和一个组合标记,比如说‘a'(Unicode 字符0097)和沉音符(Unicode 字符0300),然后创建一个单独的由两个标记组合而成的字符。

COMPOSE 使用非凡的组合标记,而没有使用 ASCII 中相应的音节标记,它所使用的非凡的组合标记是 Unicode 标准 的一部分。上面的例子的结果应该是 Unicode 字符00E0(有一个沉音符的小写拉丁字母‘a')。

在 ANSI 中最常见的组合字符有: U+0300:沉音符(grave accent)( ` )。 U+0301:重音符(acute accent)( ' )。 U+0302:抑扬音符号(circumflex accent)(^)。 U+0303:颚化符号(tilde)(~)。 U+0308:元音变音 ?。

假如没有非凡的软件或者键盘驱动程序的话,很难在键盘上输入 Unicode 字符0097和0300。因此,以纯 ASCII 文本输入 Unicode 序列的一个方法是使用 UNISTR 函数。

这个函数接受一个 ASCII 字符串然后以国家字符集(通常作为16位 Unicode 或者 UTF-8 字符集安装)创建一个 Unicode 字符的序列。

它使用十六进制占位符序列映射任何非 ASCII 字符,映射方式与 Java 类似。

要输入a后接一个沉音符组合字符的序列,可以使用 UNISTR(‘a300'),而不要试图直接在代码中输入字符。

这个函数在任何字符集以及任何具有基于 Unicode 的国家字符集的数据库下都可以正常运行。

可以将多个组合字符放在函数中――可以在 UNISTR 函数中混合使用 ASCII 和 Unicode 占位符。

例如,可以像下面这样使用 UNISTR 函数:

select COMPOSE(UNISTR('Unless you are nai308ve, meet me at the cafe301 with your re301sume301.')) from dual;   

在将 UNISTR 函数的输出与 COMPOSE 组合时,可以在不查找任何值的情况下生成一个 Unicode 字符。
例如:

select 'it is true' if compose(unistr('a300')) = unistr('0e0');   

UNISTR用法
输入编码得到unicode编码的字符
http://docs.oracle.com/cd/B19306_01/server.102/b14200/functions204.htm
UNISTR(string)

UNISTR takes as its argument a text literal or an expression that resolves to character data and returns it in the national character set. 
The national character set of the database can be either AL16UTF16 or UTF8. 
UNISTR provides support for Unicode string literals by letting you specify the Unicode encoding value of characters in the string. 
This is useful, for example, for inserting data into NCHAR columns.

The Unicode encoding value has the form '\xxxx' where 'xxxx' is the hexadecimal value of a character in UCS-2 encoding format. 
Supplementary characters are encoded as two code units, the first from the high-surrogates range (U+D800 to U+DBFF), and the second from the low-surrogates range (U+DC00 to U+DFFF). 
To include the backslash in the string itself, precede it with another backslash (\\).

For portability and data preservation, Oracle recommends that in the UNISTR string argument you specify only ASCII characters and the Unicode encoding values.

SELECT UNISTR('abc\00e5\00f1\00f6') FROM DUAL;

UNISTR
------
abcåñö

COMPOSE用法
将两个unicode编码的字符合成,例如字母与沉音符合成为另一个UNICODE字符
http://docs.oracle.com/cd/B19306_01/server.102/b14200/functions025.htm
COMPOSE(char)

COMPOSE takes as its argument a string, or an expression that resolves to a string, in any datatype, and returns a Unicode string in its fully normalized form in the same character set as the input. 
char can be any of the datatypes CHAR, VARCHAR2, NCHAR, NVARCHAR2, CLOB, or NCLOB. For example, an o code point qualified by an umlaut code point will be returned as the o-umlaut code point.

CLOB and NCLOB values are supported through implicit conversion. If char is a character LOB value, it is converted to a VARCHAR value before the COMPOSE operation. 
The operation will fail if the size of the LOB value exceeds the supported length of the VARCHAR in the particular development environment.

SELECT COMPOSE ( 'o' || UNISTR('\0308') ) FROM DUAL; 

CO 
-- 
ö 

DECOMPOSE用法
将带有合成字符的字符串,解析成合成前的UNICODE字符串
http://docs.oracle.com/cd/B19306_01/server.102/b14200/functions041.htm
DECOMPOSE(string)

DECOMPOSE is valid only for Unicode characters. DECOMPOSE takes as its argument a string in any datatype and returns a Unicode string after decomposition in the same character set as the input. 
For example, an o-umlaut code point will be returned as the "o" code point followed by an umlaut code point.

SELECT DECOMPOSE ('Châteaux') FROM DUAL; 

DECOMPOSE
---------
Cha^teaux

PostgreSQL 支持compose, decompose, unistr

自定义映射关系
需要用户自定义合成字母与字母,unicode沉音符的映射关系, 进行编码后存在表或者代码中。

自定义函数
基于对应关系的编码,合成,或解码字符串。

unicode码表

http://unicode-table.com/cn

参考

http://unicode-table.com/cn

http://www.th7.cn/db/Oracle/2011-06-30/8490.shtml

Count

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
7月前
|
关系型数据库 分布式数据库 数据库
PolarDB PostgreSQL版:Oracle兼容的高性能数据库
PolarDB PostgreSQL版是一款高性能的数据库,具有与Oracle兼容的特性。它采用了分布式架构,可以轻松处理大量的数据,同时还支持多种数据类型和函数,具有高可用性和可扩展性。它还提供了丰富的管理工具和性能优化功能,为企业提供了可靠的数据存储和处理解决方案。PolarDB PostgreSQL版在数据库领域具有很高的竞争力,可以满足各种企业的需求。
|
3月前
|
Oracle NoSQL 关系型数据库
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
557 2
|
7月前
|
人工智能 Oracle 关系型数据库
一篇文章弄懂Oracle和PostgreSQL的Database Link
一篇文章弄懂Oracle和PostgreSQL的Database Link
|
7月前
|
SQL Oracle 关系型数据库
常用数据库的分页语句(mySQL、oracle、PostgreSQL、SQL Server)
常用数据库的分页语句(mySQL、oracle、PostgreSQL、SQL Server)
|
SQL Oracle 关系型数据库
Oracle,Postgresql等数据库使用
Oracle,Postgresql等数据库简单使用
172 0
Oracle,Postgresql等数据库使用
|
SQL Oracle 关系型数据库
Polar DB-O (兼容 Oracle 语法版本)和Polar DB PostgreSQL 版本概述(二)
Polar DB-O (兼容 Oracle 语法版本)和Polar DB PostgreSQL 版本概述(二)
1831 0
|
7月前
|
存储 Oracle 关系型数据库
PolarDB 开源版通过orafce支持Oracle兼容性
背景PolarDB 的云原生存算分离架构, 具备低廉的数据存储、高效扩展弹性、高速多机并行计算能力、高速数据搜索和处理; PolarDB与计算算法结合, 将实现双剑合璧, 推动业务数据的价值产出, 将数据变成生产力.本文将介绍PolarDB开源版通过orafce支持Oracle兼容性 .测试环境为m...
137 0
|
2月前
|
存储 Oracle 关系型数据库
Oracle数据库的应用场景有哪些?
【10月更文挑战第15天】Oracle数据库的应用场景有哪些?
185 64
|
3天前
|
存储 Oracle 关系型数据库
数据库数据恢复—ORACLE常见故障的数据恢复方案
Oracle数据库常见故障表现: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE ASM存储破坏。 3、ORACLE数据文件丢失。 4、ORACLE数据文件部分损坏。 5、ORACLE DUMP文件损坏。
32 11
|
16天前
|
Oracle 关系型数据库 数据库
Oracle数据恢复—Oracle数据库文件有坏快损坏的数据恢复案例
一台Oracle数据库打开报错,报错信息: “system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。管理员联系我们数据恢复中心寻求帮助,并提供了Oracle_Home目录的所有文件。用户方要求恢复zxfg用户下的数据。 由于数据库没有备份,无法通过备份去恢复数据库。

相关产品

  • 云原生数据库 PolarDB
  • 云数据库 RDS PostgreSQL 版
  • 推荐镜像

    更多