开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks写udf函数,没起作用,单独执行脚本是成功的,帮忙看看是哪的问题?

DataWorks写udf函数,没起作用,单独执行脚本是成功的,帮忙看看是哪的问题?

-- coding: utf-8 --

from odps.udf import annotate

@annotate('string->string')
class convert_latin_to_english(object):
def init(self):
self.mapping = {
'à': 'a', 'á': 'a',
'â': 'a', 'ã': 'a', 'ä': 'a', 'å': 'a', 'æ': 'ae', 'ç': 'c', 'è': 'e',
'é': 'e', 'ê': 'e', 'ë': 'e', 'ì': 'i', 'í': 'i', 'î': 'i', 'ï': 'i',
'ð': 'd', 'ñ': 'n', 'ò': 'o', 'ó': 'o', 'ô': 'o', 'õ': 'o', 'ö': 'o',
'ø': 'o', 'ù': 'u', 'ú': 'u', 'û': 'u', 'ü': 'u', 'ý': 'y', 'þ': 'th',
'ß': 'ss', 'ā': 'a', 'ă': 'a', 'ą': 'a', 'ć': 'c', 'ĉ': 'c', 'ċ': 'c',
'č': 'c', 'ď': 'd', 'đ': 'd', 'ē': 'e', 'ĕ': 'e', 'ė': 'e', 'ę': 'e',
'ě': 'e', 'ĝ': 'g', 'ğ': 'g', 'ġ': 'g', 'ģ': 'g', 'ĥ': 'h', 'ħ': 'h',
'ĩ': 'i', 'ī': 'i', 'ĭ': 'i', 'į': 'i', 'ı': 'i', 'ij': 'ij', 'ĵ': 'j',
'ķ': 'k', 'ĸ': 'k', 'ĺ': 'l', 'ļ': 'l', 'ľ': 'l', 'ŀ': 'l', 'ł': 'l',
'ń': 'n', 'ņ': 'n', 'ň': 'n', 'ʼn': 'n', 'ŋ': 'n', 'ō': 'o', 'ŏ': 'o',
'ő': 'o', 'œ': 'oe', 'ŕ': 'r', 'ŗ': 'r', 'ř': 'r', 'ś': 's', 'ŝ': 's',
'ş': 's', 'š': 's', 'ţ': 't', 'ť': 't', 'ŧ': 't', 'ũ': 'u', 'ū': 'u',
'ŭ': 'u', 'ů': 'u', 'ű': 'u', 'ų': 'u', 'ŵ': 'w', 'ŷ': 'y', 'ź': 'z',
'ż': 'z', 'ž': 'z', 'ſ': 's', 'ƀ': 'b', 'ƃ': 'b', 'ƅ': 'b', 'ƈ': 'c',
'ƌ': 'd', 'ƍ': 'd', 'ƒ': 'f', 'ƕ': 'hv', 'ƙ': 'k', 'ƚ': 'l', 'ƛ': 'l',
'ƞ': 'n', 'ơ': 'o', 'ƣ': 'oi', 'ƥ': 'p', 'ƨ': 's', 'ƪ': 's', 'ƫ': 't',
'ƭ': 't', 'ư': 'u', 'ƴ': 'y', 'ƶ': 'z', 'ƹ': 'z', 'ƺ': 'z', 'ƽ': 'z',
'ƾ': 'z', 'ƿ': 'w', 'dž': 'dz', 'lj': 'lj', 'nj': 'nj', 'ǎ': 'a', 'ǐ': 'i',
'ǒ': 'o', 'ǔ': 'u', 'ǖ': 'u', 'ǘ': 'u', 'ǚ': 'u', 'ǜ': 'u', 'ǝ': 'e',
'ǟ': 'a', 'ǡ': 'a', 'ǣ': 'ae', 'ǥ': 'g', 'ǧ': 'g', 'ǩ': 'k', 'ǫ': 'o',
'ǭ': 'o', 'ǯ': 'z', 'dz': 'dz', 'ǵ': 'g', 'ǹ': 'n', 'ǻ': 'a', 'ǽ': 'ae',
'ǿ': 'o', 'ȁ': 'a', 'ȃ': 'a', 'ȅ': 'e', 'ȇ': 'e', 'ȉ': 'i', 'ȋ': 'i',
'ȍ': 'o', 'ȏ': 'o', 'ȑ': 'r', 'ȓ': 'r', 'ȕ': 'u', 'ȗ': 'u', 'ș': 's',
'ț': 't', 'ȝ': 'g', 'ȟ': 'h', 'ȣ': 'ou', 'ȥ': 'z', 'ȧ': 'a', 'ȩ': 'e',
'ȫ': 'o', 'ȭ': 'o', 'ȯ': 'o', 'ȱ': 'o', 'ȳ': 'y', 'ȼ': 'c', 'ȿ': 's',
'ɀ': 'z', 'ɂ': 'z', 'ɇ': 'e', 'ɉ': 'j', 'ɋ': 'q', 'ɍ': 'r', 'ɏ': 'y'

         # 添加更多的映射关系
    }

def evaluate(self, s):

    # 如果输入的字符串为空,直接返回空字符串
    if not s or s =='' or not isinstance(s, str):
        return None 

    result = ''
    for char in s.lower():
        if char in self.mapping:
            result += self.mapping[char]
        else:
            result += char
    return result

执行结果image.png

展开
收起
夹心789 2024-05-27 21:20:23 29 0
0 条回答
写回答
取消 提交回答

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多