开发者社区 > 数据库 > 正文

以数据库的全量数据作为特征提取的来源,当然不少团队也在尝试使用接口调用过程中的全量入参数据。具体有?

以数据库的全量数据作为特征提取的来源,当然不少团队也在尝试使用接口调用过程中的全量入参数据。具体有哪些?

展开
收起
游客hmzk6xi5mlygs 2022-05-12 14:55:55 304 0
1 条回答
写回答
取消 提交回答
  • 1)DB全量数据查询:通过odps查询方式获取全量多表关联数据,用以作为分析的数据源。

    2)数据的聚合:对于查询的数据进行信息补齐后,字段打平,采用聚类的方式针对每一字段进行聚合,以出现有限数量的字段作为特征字段进行基线特征的沉淀,对于离散型的数据会选择合适的区间进行分段处理。

    3)特征推荐:针对上述聚合的内容进行推荐,此部分会将潜在的特征字段全量进行推荐。

    4)特征基线沉淀:基于推荐的数据,结合专家经验进行特征字段的选取,并进行标注选择为基线特征。

    2022-05-12 17:22:36
    赞同 展开评论 打赏

数据库领域前沿技术分享与交流

相关电子书

更多
DTCC 2022大会集锦《云原生一站式数据库技术与实践》 立即下载
阿里云瑶池数据库精要2022版 立即下载
2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载