PostgreSQL全角、半角互相转换

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB 分布式版,标准版 2核8GB
简介:

标签

PostgreSQL , 全角 , 半角 , 转换 , ascii , chr , 编码


背景

转载原文

http://blog.qdac.cc/?p=1289

我们知道,客户许多时候录入数据时,并不注意输入法是否是全角模式,然后就造成输入的内容,有的是全角有的是半角,造成我们做分析统计时的不便,为此,编写相应的函数。当然这个过程应尽量在前台完成,但如果针对已经存在的数据,下面提供的两个函数就比较方便了。

1、全角转换为半角函数

--© 2014,swish,原版首发:http://blog.qdac.cc/?p=1281,自由使用,保留版权    
    
create or replace function CnFullToHalf(s character varying)    
returns character varying    
as    
$$    
declare    
  retval character varying;    
  c character varying;    
  l integer;    
begin    
l=length(s);    
retval='';    
while l>0 loop    
  c=left(s,1);    
  if c=' ' then                    -- 全角空格    
    retval=retval||' ';    
  elsif c>='!' and c<='~' then    -- 全角!到~的范围    
    retval=retval || chr(ascii('!')+ascii(c)-ascii('!'));    
  else    
    retval=retval||c;    
  end if;    
  s=substring(s,2,l-1);    
  l=l-1;    
end loop;    
return retval;    
end;    
$$language plpgsql strict immutable;    

2、半角转全角

--© 2014,swish,原版首发:http://blog.qdac.cc/?p=1281,自由使用,保留版权    
    
create or replace function CnHalfToFull(s character varying)    
returns character varying    
as    
$$    
declare    
  retval character varying;    
  c integer;    
  l integer;    
begin    
l=length(s);    
retval='';    
while l>0 loop    
  c=ascii(left(s,1));    
  if c=32 then                     -- 空格    
    retval=retval||' ';    
  elsif c>=33 and c<=126 then    
    retval=retval || chr(ascii('!')+c-ascii('!'));    
  else    
    retval=retval||chr(c);    
  end if;    
  s=substring(s,2,l-1);    
  l=l-1;    
end loop;    
return retval;    
end;    
$$language plpgsql strict immutable;    

适合UTF8字符集。

例子

test01=# select CnHalfToFull('123ab?-_.*&^%#@~+_=-:;/><|\\"y');    
                         cnhalftofull                             
--------------------------------------------------------------    
 123ab?-_.*&^%#@~+_=-:;/><|\\"y    
(1 row)    
    
test01=# select CnFullToHalf('123ab?-_.*&^%#@~+_=-:;/><|\\"y');    
          cnfulltohalf              
--------------------------------    
 123ab?-_.*&^%#@~+_=-:;/><|\\"y    
(1 row)    

python 全角半角转换

全角半角字符的unicode编码关系

全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)

半角字符unicode编码从33126 (十六进制 0x21 0x7E)

空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)

除空格外,全角/半角按unicode编码排序在顺序上是对应的(半角 + 65248 = 全角)

所以可以直接通过用+-法来处理非空格数据,对空格单独处理。

用到的一些函数

chr()函数用一个范围在range(256)内的(就是0~255)整数作参数,返回一个对应的字符。

unichr()跟它一样,只不过返回的是Unicode字符。

ord()函数是chr()函数或unichr()函数的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的ASCII数值,或者Unicode数值。

PG全角半角转换函数

根据以上规则,可以写成全角半角转换函数

全角转半角

create or replace function full_to_half(text) returns text as  
$$  
select string_agg(col, '') from   
 ( select   
   case when ascii(col) >= 65281 and ascii(col) <=65374 then chr(ascii(col)-65248)  
        when ascii(col) = 12288 then chr(32)  
        else col  
   end AS col   
   from (select regexp_split_to_table($1, '') as col) t  
  ) tt;   
$$ language sql strict immutable;  

半角转全角

create or replace function half_to_full(text) returns text as  
$$  
select string_agg(col, '') from   
 ( select   
   case when ascii(col) >= 33 and ascii(col) <=126 then chr(ascii(col)+65248)  
        when ascii(col) = 32 then chr(12288)  
        else col  
   end AS col   
   from (select regexp_split_to_table($1, '') as col) t  
  ) tt;   
$$ language sql strict immutable;  

例子

test01=# select full_to_half('123ab?-_.*&^%#@~+_=-:;/><|\\"y!');  
          full_to_half             
---------------------------------  
 123ab?-_.*&^%#@~+_=-:;/><|\\"y!  
(1 row)  
  
test01=# select half_to_full('123ab?-_.*&^%#@~+_=-:;/><|\\"y!   123ab?-_.*&^%#@~+_=-:;/><|\\"y!');  
                                                            half_to_full                                                              
------------------------------------------------------------------------------------------------------------------------------------  
 123ab?-_.*&^%#@~+_=-:;/><|\\"y!   123ab?-_.*&^%#@~+_=-:;/><|\\"y!  
(1 row)  

参考

http://blog.qdac.cc/?p=1289

https://www.biaodianfu.com/python-convert-between-unicode-fullwidth-halfwidth-characters.html

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
7月前
|
SQL 存储 关系型数据库
MySQL 中将使用逗号分隔的字段转换为多行数据
在开发中,遇到逗号分隔字段的处理是常见问题。本文通过一个实际场景展示了如何改造数据存储:从单一字段存储多个页面(如`page1,page2,page3`)到使用新表`bus_pages`存储每个页面的详细配置。使用`SUBSTRING_INDEX`函数配合`help_topic`表(具有连续ID)拆分`bus_mark_info`表中的`pages`字段,按`help_topic_id`截取页面名称并插入新表。当`pages`字段超过701个页面时,需寻找其他辅助表。最终,数据成功迁移到新结构中,便于单独配置每个页面。
203 1
|
6月前
|
存储 分布式计算 DataWorks
MaxCompute产品使用合集之可以通过什么函数将全角字符转成半角字符
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
SQL Oracle 关系型数据库
oracle数据库中对汉字跟英文字母混合排序
oracle数据库中对汉字跟英文字母混合排序
92 0
|
JSON 关系型数据库 MySQL
MySQL的字符转义
MySQL的字符转义
53 0
|
关系型数据库 MySQL 数据库
|
数据库
数据库——将多个逗号转成一个逗号
数据库——将多个逗号转成一个逗号
|
关系型数据库 MySQL
Mysql字符串转换大小写
Mysql字符串转换大小写
54 0
|
存储 关系型数据库 MySQL
【Mysql】char(25)和varchat(25)可以存多少文字,多少中文和英文的逗号
【Mysql】char(25)和varchat(25)可以存多少文字,多少中文和英文的逗号
245 0
|
关系型数据库 PostgreSQL
|
关系型数据库 MySQL 机器学习/深度学习

相关产品

  • 云原生数据库 PolarDB
  • 云数据库 RDS PostgreSQL 版