备案控制台

开发者社区问答正文

传递Unicode字符串给C函数库

你要写一个扩展模块，需要将一个Python字符串传递给C的某个库函数，但是这个函数不知道该怎么处理Unicode。

展开

收起

哦哦喔 2020-04-17 18:15:22 3041 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

景凌凯

有点尴尬唉你要寻找的东西已经被吃掉啦！

传递Unicode字符串给C函数库：可以参考这篇文章： https://www.baidu.com/link?url=6djl4oF9q-bjXsKIc7n5xA5eoO3YbD_ISURCaytWx9o0B2dmmEhXclgxb_R

2020-04-17 23:56:29

赞同展开评论

哦哦喔

这里我们需要考虑很多的问题，但是最主要的问题是现存的C函数库并不理解Python的原生Unicode表示。 因此，你的挑战是将Python字符串转换为一个能被C理解的形式。

为了演示的目的，下面有两个C函数，用来操作字符串数据并输出它来调试和测试。 一个使用形式为 char *, int 形式的字节， 而另一个使用形式为 wchar_t *, int 的宽字符形式：

void print_chars(char *s, int len) {
  int n = 0;

  while (n < len) {
    printf("%2x ", (unsigned char) s[n]);
    n++;
  }
  printf("\n");
}

void print_wchars(wchar_t *s, int len) {
  int n = 0;
  while (n < len) {
    printf("%x ", s[n]);
    n++;
  }
  printf("\n");
}
对于面向字节的函数 print_chars() ，你需要将Python字符串转换为一个合适的编码比如UTF-8. 下面是一个这样的扩展函数例子：

static PyObject *py_print_chars(PyObject *self, PyObject *args) {
  char *s;
  Py_ssize_t  len;

  if (!PyArg_ParseTuple(args, "s#", &s, &len)) {
    return NULL;
  }
  print_chars(s, len);
  Py_RETURN_NONE;
}
对于那些需要处理机器本地 wchar_t 类型的库函数，你可以像下面这样编写扩展代码：

static PyObject *py_print_wchars(PyObject *self, PyObject *args) {
  wchar_t *s;
  Py_ssize_t  len;

  if (!PyArg_ParseTuple(args, "u#", &s, &len)) {
    return NULL;
  }
  print_wchars(s,len);
  Py_RETURN_NONE;
}
下面是一个交互会话来演示这个函数是如何工作的：

>>> s = 'Spicy Jalape\u00f1o'
>>> print_chars(s)
53 70 69 63 79 20 4a 61 6c 61 70 65 c3 b1 6f
>>> print_wchars(s)
53 70 69 63 79 20 4a 61 6c 61 70 65 f1 6f
>>>
仔细观察这个面向字节的函数 print_chars() 是怎样接受UTF-8编码数据的， 以及 print_wchars() 是怎样接受Unicode编码值的

2020-04-17 18:15:31

赞同展开评论

问答分类：

Python

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83643

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3700

1

0

sql server的用户名和密码怎么查啊？

37499

21

0

重启Docker后报错：Error response from daemon

2287

0

0

this xml file does not appear to have any style in

51855

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60918

32

0

OSS的endpoint如何查看

37486

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3643

1

0

阿里云服务器如何重置系统？

24716

4

0

LoRa的网络覆盖能力范围是怎么样的？

3147

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

基于Python+django的大学生自习室预约系统

AgentRun Sandbox SDK 正式开源！集成 LangChain 等主流框架，一键开启智能体沙箱新体验

如何保证Python采集淘商品详情数据的准确性？API接口系列

AI搜索引擎内容、GEO优化工具开发工程的“可信赖”基石：内容真实性、权威性与ADSM工程化闭环

支持"同款搜索"（精确匹配）和"相似搜索"（模糊匹配）两种模式

还有其他疑问?