在SPARK SUMMIT 2017上,Kees Jan de Vries,• Data Scientist at Booking.com分享了题为《Building a Real-Time Fraud Prevention Engine Using Open Source (Big Data) Software》,就运行示例,概率,实时预测引擎:经验教训,综合特征,模型培训和部署等方面的内容做了深入的分析。
https://yq.aliyun.com/download/2211?spm=a2c4e.11154804.0.0.4b0b6a79PU28Aw
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
Kees Jan de Vries在Spark Summit 2017上的分享《Building a Real-Time Fraud Prevention Engine Using Open Source (Big Data) Software》是一个非常有价值的内容,它聚焦于如何利用开源大数据软件构建实时的欺诈预防系统。虽然我无法直接访问外部链接或下载文件,但我可以基于这个主题提供一些相关的阿里云产品和解决方案的信息,帮助你理解如何在阿里云平台上实现类似的功能。
阿里云MaxCompute:作为大数据处理平台,MaxCompute(原名ODPS)能够处理PB级别的数据,非常适合进行大规模的数据存储和计算,这是构建欺诈检测模型的基础。你可以使用MaxCompute进行数据清洗、特征工程以及模型训练等步骤。
阿里云PAI(Platform of Artificial Intelligence):PAI是阿里云的一站式机器学习平台,提供了丰富的算法库和模型开发工具,支持包括Spark在内的多种计算引擎。你可以利用PAI来快速搭建和部署欺诈预测模型,实现从数据预处理、特征选择、模型训练到在线预测的全链路服务。
实时流处理——DataHub与Blink/Flink:为了实现实时的欺诈预防,可以结合使用阿里云DataHub收集实时数据流,并通过Blink(基于Apache Flink)进行实时处理和分析。这样可以在数据产生的瞬间就进行欺诈行为的识别和响应。
模型在线部署与服务化——PAI-EAS:PAI-ModelaaS(现升级为EAS,即模型在线服务)允许用户将训练好的模型快速部署为在线服务,实现低延迟的预测响应。这对于需要即时反馈的欺诈预防系统至关重要。
安全与合规:在处理敏感数据时,确保遵循相关法律法规非常重要。阿里云提供了一系列的安全产品和服务,如数据加密服务、安全审计等,以保障数据处理过程中的安全性与合规性。
综上所述,阿里云提供了一整套强大的工具和服务,可以帮助企业基于开源技术构建高效、实时的欺诈预防系统,同时确保数据处理的效率、安全性和合规性。参考Kees Jan de Vries的分享内容,结合阿里云的产品和技术,可以有效地实施欺诈检测策略并优化业务流程。