• 系统会收集大量的用户行为事件(比如说浏览、点击等),以及交易记录(比如说从 OLTP 数据库同步过来的付款记录等)。这些数据量非常巨大(可能高达每秒种数千万甚至 上亿条),并且其中的绝大部分不是来自交易系统。为了方便以后使用,这些数据会导入 到系统里(图中的 a),同时它们会和各种维表数据做关联推导出一系列重要的特征(图 中的 1),这些特征会实时更新到推荐系统以优化用户体验。这里的实时维表关联需要低 延迟高吞吐的点查支持才能跟得上新产生的数据。
• 系统也会使用滑动窗口等方式去计算出各种不同维度和时间粒度的特征(比如说一个商品 过去 5 分钟的点击数、过去 7 天的浏览量和过去 30 天的销售等)。根据滑动窗口的粒 度,这些聚合可能通过流计算或者批处理的方式完成。
以上内容摘自《阿里云实时数仓Hologres最佳实践合集》电子书,点击https://developer.aliyun.com/topic/download?id=996 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等,也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975