作者:杨哲超
《Gartner 2021十大数据和分析趋势》中指出,图技术使一切产生关联,预测到2025年图技术在数据和分析创新中的占比将从2021年的10%上升到80%。该技术将促进整个企业机构的快速决策。从金融行业角度看,在中国人民银行印发《金融科技(FinTech) 发展规划(2019—2021年)》 等政策驱动下,通过构建金融知识图谱基于多维数据源做决策,可以有效带动金融机构降本增效。
图数据库GDB是阿里云自主研发的图数据库产品,经历阿里巴巴集团内丰富的应用场景打磨,具备了丰富的最佳实践。图数据库GDB在2020年进入Forrester图数据平台竞争者象限,也是国内图数据库产品首次入选。阿里云图数据库GDB在满足高可靠性、高性能的同时,也兼顾了低成本的特性,产品使用、运维成本仅为国外图数据库产品的40%。我们将自动特征工程、自动机器学习等AI能力下沉到图数据库引擎中,形成阿里云图智能平台,让整个图模型的构建、分析、发布过程自然连贯。阿里云图智能平台在金融行业已经帮助银行、保险等领域客户构建了金融风控、商品推荐、循环担保检测、异常指标监控、违规团伙挖掘等场景,通过穿透行业应用场景,帮助客户基于多维数据做出精准决策。
传统的金融风控模型,能够汇集各个数据源的属性特征信息,但是比较难挖掘数据源之间的深度关联关系。要深度并且快速的挖掘海量数据的关联特征,则会面临非常大的技术挑战。图技术的意义在于将信息升维,而机器学习技术的意义在于对数据规律进行总结。通过图表示学习技术,提取金融知识图谱中的拓扑信息特征,并通过图自动特征工程模块,自动构建特征作为风控模型的输入条件参与模型训练。通过自动机器学习模块,帮助金融机构挑选、调试、集成各个机器学习模型,实现更高精度的风控模型。
华瑞银行于2020年正式引入阿里云图数据库GDB,通过对数据资产进行深度关联关系分析,进一步提升风险识别能力。通过打造一套企业级图分析平台,实现了对智慧供应链、航旅消费贷款等业务的智能风险管控。通过阿里云图数据库GDB集成的自动机器学习组件,华瑞银行大幅降低了风控模型研发周期,并在截止目前的实践中检测到6个诈骗团伙,有效防控了业务风险。
图数据库的应用可以在高度关联的数据中挖掘数据源间的深度关联关系,通过理解和分析图将信息升维,进而帮助企业获取洞察,这将成为企业未来核心的竞争力。我们也会不断完善我们的图数据库产品和服务,探求用户真正的需求,以帮助更多企业和开发者获得洞察力和竞争优势。