一年一度最火热的国际人工智能顶会NeurIPS 2019于当地时间12月8日至14日在加拿大温哥华举办。作为人工智能和机器学习领域最顶级的盛会之一,每年都会吸引大量专家、学者和AI领域从业人员参与。
据悉,今年NeurIPS 2019论文投稿数量创造了新纪录,吸引了全球范围内共6743篇有效论文投递,而录取率只有21.17%。蚂蚁金服也有多篇论文入选,聚焦对抗生成网络GAN、图神经网络GNN、深度强化学习等课题。
在会上,蚂蚁金服与阿里巴巴共同举办了一场专家云集的主题workshop,蚂蚁金服研究员宋乐与楚巍分别带来了精彩演讲,分享了人工智能在蚂蚁金服业务的应用场景与实践。除了workshop,在本届NeurIPS展台上,支付宝展出的基于图像识别技术的智能垃圾分类小程序和智能回收箱视频也吸引了众多学者的关注,现场观众通过手机拍照即可轻松识别垃圾物品和对应的垃圾类别。
优秀论文解读之通用深度指数分布族研究
其中的一篇入选的优秀论文是《使用对抗式动态系统嵌入的深度指数族分布估计》,内容涉及通用深度指数分布族的最大似然估计的求解,以及高效的利用其进行推断。
指数分布族 (exponential family),同时又被称为能量模型(energy-based model),是一类广泛应用的生成式概率模型。通过和深度模型结合,指数分布族能够灵活的拟合各种数据分布。由于指数分布族的灵活性,目前已经有越来越多的研究者利用指数分布族对各种结构数据进行建模。例如,将能量模型用于对蛋白质结构预测,从而更好的指导药物设计和材料科学;将能量模型用于语言模型及句子生成;将能量模型用于基于模型的强化学习等等。
这些都展示了指数族分布能量模型作为有别于变分自编码器(variationalautoencoder)和对抗式生成模型(generative adversarial network)之外,另一种截然不同的生成式模型的能力和潜在应用。但是,如何有效的求解通用指数分布族的最大似然估计(MLE)以及如何高效的进行推断仍然是一个亟待解决的问题。
针对通用深度指数分布族有效求解最大似然估计这一问题,蚂蚁金服研究人员利用最大似然的primal-dualreformulation,将原始MLE中不可解的log-partition函数重写成能量函数(potential function)针对对一个可学习的负样本采样器(negative sampler)的期望。通过这样的形式,可以同时学习能量函数以及负样本采样器。相比现存的方法,使用手工设计的固定的,我们的算法可以根据训练样本自动调整负样本采样器,以便更好的学习模型。与此同时,学习得到的负样本采样器可以用来平摊统计推断(amortized inference)。
优秀论文解读之图神经网络的创新应用
另一篇入选的优秀论文《使用条件图逻辑网络的逆合成分析预测》,介绍的是蚂蚁研究人员创造性的提出了一种新的图神经网络,使用它提升了逆合成分析预测的成绩。
逆合成分析是有机化学中重要的几个问题之一。给定一个产物,该分析过程需要给出可能用来参与生成该产物的反应物。该方向近年来得到了来自化学和计算机科学领域的关注。在这篇文章中,蚂蚁金服研究人员提出一个叫做条件图逻辑网络(Conditional Graph Logic Network, GLN)的新模型来解决这个问题。该模型通过图神经网络学习如何应用化学反应的模板,并且隐式地考虑到了结果的可行性以及重要性。为了降低计算代价,提出一种层次化的高效采样方法。在标准数据集中,新方法的正确率相比于当前最好的方法提升了8.2%,同时该方法也能够提供相关的可解释性分析。
蚂蚁金服拥有丰富的人工智能技术应用场景,不仅在智能客服、小微贷款、健康险自动理赔、交易安全风控、反洗钱、智能营销、智能助理等领域取得突破,还沉淀了业界领先的分布式机器学习平台支持大规模深度图算法、在线学习、共享学习、强化学习等能力,以及金融知识图谱、机器人平台、NLP平台等通用能力。
“发展和使用人工智能技术,我们能够为蚂蚁金服全球超过12亿的用户解决真正的问题,提供真正有意义的服务。”蚂蚁金服副总裁及首席AI科学家漆远表示。
事实上,在人工智能领域,除了NeurIPS,蚂蚁金服也多次亮相ICML、AAAI、SIGIR、KDD等国际顶级学术会议,为学界带来了诸多来自实际业务场景的创新研究和应用分享。对蚂蚁金服而言,在顶级学术会议上发布论文,一方面可推进人工智能最前沿研究的发展,将学术研究与应用相结合,另一方面可推进前沿技术从研究到实际应用中落地,为用户带来价值,为我们的生活服务带来改变。
未来,蚂蚁金服将继续加大对AI技术的研究和投入,通过技术创新和科技开放更好地推动普惠金融发展,为世界带来平等的机会。