开发者社区> 问答> 正文

ODPS中如何添加Python库为资源?

目前正在使用公测的Python UDF功能, 写了几个NLP方面的UDTF, 用到了jieba分词库.
将UDTF注册后, 在odpscmd客户端中运行, 返回结果:

FAILED: ODPS-0140051:Invalid function - class 'PyWordSegment.PyWordSegment' Traceback (most recent call last):
File "", line 46, in get_signature

clz = utils.import_from_string(object_path)

File "", line 130, in import_from_string

mod = __import__(modname, globals(), locals(), [], -1)

File "", line 6, in

import jieba.posseg as jieba_pos

ImportError: No module named jieba.posseg
for function 'pywordsegment'

这时该如何将整个jieba库作为资源导入ODPS中? 已经试过将其打成zip包上传并让UDTF引用, 但无论上传为file还是上传为archive都无效, 报错相同.

展开
收起
littlemagic 2018-03-23 18:17:06 3951 0
2 条回答
写回答
取消 提交回答
  • 如果只是分词的话建议直接用阿里分词

    2019-07-17 22:02:56
    赞同 展开评论 打赏
  • 在Import之前os.system("pip install your_library")试试

    2019-07-17 22:02:56
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载