在机器学习PAI创建了一个实时的特征视图后,里面的数据是通过这个“实时计算控制台”往里传入数据吗?特征平台 结合 实时计算 这部分操作有没有最佳实践案例呀?
在机器学习PAI中创建的实时特征视图,里面的数据不是通过“实时计算控制台”传入的。
实时特征视图的数据通常来自于在线特征数据,这些数据会被注册到FeatureStore中的视图表。实时特征视图支持自定义表结构的写入方式,这意味着用户可以根据需要手动添加视图字段并配置字段属性。当外部数据进入特征平台时,它们会通过特征视图(FeatureView)进行指定,包括数据来源(DataSource)、数据进入特征存储(FeatureStore)所需的转换(特征工程/Transformation)、特征的模式(特征名称+类型),以及数据需要存放的位置(OnlineStore/OfflineStore)等。
此外,PAI-FeatureStore设计上整合了在线和离线特征处理流程,可以自动完成在线和离线表的构建,并且保持特征定义和数据的一致性。对于实时特征,FeatureStore会直接对接线上实时数仓服务(如Hologres),使得线上服务可以直接从在线存储中获取最新的实时特征数据,而不需要额外的特征线上落盘步骤。
因此,实时特征视图的数据通常是通过与线上实时数仓服务的对接来获取的,而不是通过某个单独的控制台传入。这种方式确保了线上线下特征数据的一致性,并且提供了统一的特征注册、管理和访问接口。
可以看这个:https://help.aliyun.com/zh/flink/developer-reference/tablestore-connector
flink 写入到 tablestore 此回答整理自钉群“PAI-FeatureStore特征平台应用交流”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。