开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

MaxCompute中用odps想找出存的生僻字,有什么办法吗?

MaxCompute中用odps想找出存的生僻字,有什么办法吗?

展开
收起
冰激凌甜筒 2023-05-22 14:34:03 68 0
1 条回答
写回答
取消 提交回答
  • 存在即是合理

    在MaxCompute中,可以使用ODPS的API来查询生僻字。

    以下是一个简单的示例代码:

    import odps.datasources.odps.DsContext;
    import odps.datasources.odps.Table;
    import java.util.Arrays;
    import java.util.List;
    
    public class FindRareWords {
        public static void main(String[] args) throws Exception {
            DsContext context = new DsContext();
            // 设置数据源为odps
            Table table = context.getTable("your_table_name");
            String[] fields = {"word"};
            List<String> rareWords = Arrays.asList("生僻字", "罕用字", "罕见字", "冷僻字", "偏僻字");
            // 根据字段名和值进行筛选
            table.filter(new DsContext.Filter() {
                @Override
                public boolean filter(Record record) {
                    String word = record.getStr("word");
                    return rareWords.contains(word);
                }
            });
            System.out.println("找到的生僻字有:" + table.count());
        }
    }
    

    以上代码中,首先创建了一个ODPS数据源,并选择需要查询的表。然后设置需要查询的字段名和生僻字列表,最后使用filter()方法对表进行筛选,只保留符合条件的记录。最后输出找到的生僻字数量即可。

    2023-05-24 18:22:05
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载