备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

MaxCompute中用odps想找出存的生僻字，有什么办法吗？

MaxCompute中用odps想找出存的生僻字，有什么办法吗？

展开

收起

冰激凌甜筒 2023-05-22 14:34:03 117 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

武当张三丰丶

存在即是合理

在MaxCompute中，可以使用ODPS的API来查询生僻字。

以下是一个简单的示例代码：

import odps.datasources.odps.DsContext;
import odps.datasources.odps.Table;
import java.util.Arrays;
import java.util.List;

public class FindRareWords {
    public static void main(String[] args) throws Exception {
        DsContext context = new DsContext();
        // 设置数据源为odps
        Table table = context.getTable("your_table_name");
        String[] fields = {"word"};
        List<String> rareWords = Arrays.asList("生僻字", "罕用字", "罕见字", "冷僻字", "偏僻字");
        // 根据字段名和值进行筛选
        table.filter(new DsContext.Filter() {
            @Override
            public boolean filter(Record record) {
                String word = record.getStr("word");
                return rareWords.contains(word);
            }
        });
        System.out.println("找到的生僻字有：" + table.count());
    }
}

以上代码中，首先创建了一个ODPS数据源，并选择需要查询的表。然后设置需要查询的字段名和生僻字列表，最后使用filter()方法对表进行筛选，只保留符合条件的记录。最后输出找到的生僻字数量即可。

2023-05-24 18:22:05

赞同展开评论

问答分类：

分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute MaxCompute 云原生大数据计算服务 MaxCompute odps 大数据开发治理平台 DataWorks maxcompute 大数据开发治理平台 DataWorks办法云原生大数据计算服务 MaxCompute odps办法

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

要在MaxCompute中将一行以逗号分隔的字符串拆分成多列可以使用什么办法？

212

0

0

在大数据计算MaxCompute中，odps java sdk 支持一次性执行多条sql吗？

197

1

0

在大数据计算MaxCompute中，请问有办法通过tunnel sdk读取delta 表数据吗？

153

1

0

在大数据计算MaxCompute中，这个有啥办法吗？

89

1

0

DataWorks需要检查mysql数据源更新时间有今天的数据了,有没有办法配置?

103

1

0

DataWorks有办法在实时同步的过程中，给一个字段赋值实际的同步时间吗？

104

1

0

在大数据计算MaxCompute中，是否有保存变量的办法？

178

2

0

在大数据计算MaxCompute中，合并小文件语句有没有办法通过sdk执行？

156

1

0

大数据计算MaxCompute 这个需求有没有什么好的办法？

70

1

0

DataWorks有办法确认pai节点为什么改公共调度资源组-->独享调度资源组会报错吗？

117

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

如何做好SQL质量监控

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

较 Trino 省 67% 成本，速度快 10 倍，中通快递基于 SelectDB 的湖仓分析架构

如何做好SQL质量监控

别让大数据“全表扫描”掏空你：数据分区策略与分区裁剪的实战心经

热门讨论

热门文章

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

Dataworks中MaxCompute表怎么创建唯一索引啊?

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问大数据计算MaxCompute中有没有类似mysql中这样的设置事务级别的变量的方法？

sparksql中cte物化方式是怎样的

大数据计算MaxCompute我这边想更改字段长度报错了？

在大数据计算MaxCompute中，这要怎么修改字段类型？

大数据计算MaxCompute阿里云一个CU对应多少cpu和内存？

大数据计算MaxCompute 目前不支持其他格式的csv文件吗？

大数据计算MaxCompute的group by 时合并array , 用什么方法？

展开全部

MaxCompute计费命令详解

Spark DataFrame 不是真正的 DataFrame

odps是什么?

网站代码网站源代码网页源代码网页代码网站

数据湖 VS 数据仓库之争？阿里提出大数据架构新概念：湖仓一体

解密淘宝推荐实战，打造 “比你还懂你” 的个性化APP

SREWorks数智运维平台开源一周年 | 智能运维aiops的回顾与展望

高效使用 PyODPS 最佳实践

图（关系网络）数据分析及阿里应用

构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践

展开全部

还有其他疑问?