在今年的国际人工智能联合会议(IJCAI)上,阿里巴巴有11篇论文入选。这是继今年的CVPR会议入选4篇、KDD会议入选5篇后,阿里巴巴在人工智能顶级会议上斩获的最新成果。
IJCAI被认为是人工智能领域最顶级的学术会议之一,涵盖机器学习、计算可持续性、图像识别、语音技术、视频技术等,对全球人工智能行业具有巨大影响力。今年IJCAI共收到2540篇论文投稿,再创历史新高,最终录用660篇,录用率26%。
阿里巴巴入选的11篇论文中,有6篇论文来自阿里巴巴-浙大前沿技术联合研究中心,3篇来自蚂蚁金服,均被主会收录。另外2篇来自天猫和菜鸟物流,被主题为“AI Applications inE-Commerce”的Workshop收录。
IJCAI阿里巴巴workshop现场照片
今年3月,阿里巴巴推出NASA计划,面向未来20年组建强大的独立研发机构,为服务近20亿人的新经济体储备核心科技。为实现该目标,一方面由金榕、华先胜、任小枫等技术领军人物,组建iDST、AI Labs等研究机构;另一方面发布首个全球性科研项目“AIR”计划,推进计算机科学领域基础性、前瞻性、突破性的研究,构建技术生态。
当前的阿里巴巴正从“互联网+模式”的商业模式创新引领者,变成科技创新的引领者。
以下为IJCAI2017阿里巴巴入选论文(前6篇来自阿里-浙大前沿技术联合研究中心,后3篇来自蚂蚁金服)
Image Gradient-based Joint DirectVisual Odometry for Stereo Camera
一种基于图像梯度联合优化的双目视觉里程计算法
作者:朱建科
本文中提出了一个全新的并且可以改进收敛获得更精确姿态的双目里程计方法。我们算法的关键部分是一个基于多尺度金字塔构架的双雅克比优化方法,并介绍了一个基于梯度特征的图像表示方式。这使得我们的算法对光线变化很鲁棒。创新地提出的联合优化的双目视觉里程计算法将结合最新帧和之前关键帧的信息。
地址:
https://www.ijcai.org/proceedings/2017/0636.pdf
DeepFacade: A Deep Learning Approach to Facade Parsing
深度表面:一种基于深度学习的建筑表面解析方法
作者:刘汉唐,张加良,朱建科,许主洪
我们提出一种基于深度学习的解析建筑物表面的方法。人工制造的建筑规则通常具有很高的对称性。基于这个观察,我们为神经网络提出了一个对称的约束项。我们的方法可以同时采用深度学习和人工先验信息的优点。我们通过给FCN-8s增加对称损失函数来检测我们方法的效果。实验结果显示我们的方法在ECP和eTREIMS数据集上打败了之前领域内最先进的方法,是第一个在全图尺度上使用深度神经网络的方法。
地址:
https://www.ijcai.org/proceedings/2017/0320.pdf
CFNN: Correlation Filter Neural Network forVisual Object Tracking
CFNN:一种协相关滤波神经网络的可视物体跟踪算法
作者:李洋,徐展 ,朱建科
我们提出了一个新颖的协相关滤波神经网络结构以及一整套跟踪算法,是传统卷积神经网络的一个特例。它的网络初始化不需要在任何额外数据集上进行任何的提前训练。得益于循环采样技术,我们提出的方法在网络初始化时便可以得到有效的判别能力并且在网络更新时兼具向后传播算法的优势从而习得新样本的外观变化。整个跟踪过程同时继承了卷机网络以及协相关滤波算法的互补优势。
地址:
https://www.ijcai.org/proceedings/2017/0309.pdf
Deep Optical Flow EstimationVia Multi-Scale Correspondence Structure Learning
基于多尺度对应结构化学习的深度光流估计
作者:赵杉杉,李玺,奥马
我们提出的MSCSL学习框架利用深度学习得到多尺度特征空间,进而在该深度特征空间中学习多尺度图像之间的对应结构。MSCSL通过建立一个空间卷积GRU(SpatialConv-GRU)神经网络模型去自适应地建模不同尺度对应结构之间的内在依赖关系。最后,在端到端深度学习框架中实现上面两个过程。
地址:
https://www.ijcai.org/proceedings/2017/0488.pdf
Group-wise Deep Co-saliencyDetection
基于端到端全卷积神经网络的组协同显著性检测
作者:魏李娜,赵杉杉,奥马,李玺,吴飞
我们设计了一个统一的端到端深度学习框架对组内共享特征和单张图像特征的互动及关联关系进行联合学习,从而使模型更具准确性和鲁棒性。
地址:
https://www.ijcai.org/proceedings/2017/0424.pdf
Boosted Zero-Shot Learningwith Semantic Correlation Regularization
基于语义相关性约束的提升零样本分类学习
作者:皮特,李玺,张仲非
我们设计了一个语义相关性正则化(SCR)方法,以约束提升分类模型使之与类别间的语义相关性结构相一致。随着将SCR正则化嵌入提升分类,以及嵌入针对鲁棒学习的自控制样本选择过程,我们提出了一个统一的框架,基于语义相关性约束的提升零样本分类模型(BZ-SCR)。通过平衡受SCR正则化的提升模型选择过程和自控制的样本选择过程,BZ-SCR能够捕捉从特征到类别语义的有判别性的、可适应的校准,同时保证被学习样本的可靠性和对目标类别的适应性。
地址:
https://www.ijcai.org/proceedings/2017/0362.pdf
Local Linear Factorization Machines
Chenghao Liu, Teng Zhang, Peilin Zhao, Jun Zhou, Jianling Sun
局部线性因子分解机
刘成昊, 张腾, 赵沛霖, 周俊, 孙建伶
摘要:因子分解机(FM)是一种被广泛应用的方法,因其在分类和回归任务中可以高效利用高阶特征交互。不幸地,尽管对因子分解机有不断增长的兴趣,现存工作仅仅考虑了输入特征的二阶信息。这限制了它在非线性问题上的能力且不能捕捉更复杂数据的潜在结构。在这个工作中,我们提出了一种新的局部线性因子分解机(LLFM)。它利用局部编码技术克服了上述FM的缺陷。现存局部编码分类器的学习方法包含了一个无监督锚点学习阶段和一个预定义的局部编码方案。由于编码方案中没有利用数据的类别信息,这些方法会导致用于预测的编码是次优的。不同于已有方法,我们在锚点、局部编码坐标、和FM参数上规划出一个联合优化方案,来最小化分类或回归风险。最后,我们通过实验证明了,我们的方法取得了比其他已有FM方案、以及利用无监督锚点学习和预定义编码的LLFM明显更好的预测精度。
论文链接:https://www.ijcai.org/proceedings/2017/0319.pdf
Learning User Dependencies for Recommendation
Yong Liu, Peilin Zhao, Xin Liu, Min Wu, Lixin Duan, Xiaoli Li
为推荐学习用户相关性
刘勇, 赵沛霖, 刘星, 吴敏, 段立新, 李晓黎
摘要:社交推荐系统利用用户的社交关系来提高推荐精度。直觉上来讲,一个用户对于不同的场景倾向于信任不同的用户。因此,社交推荐的一个主要挑战是对于一个给定的推荐任务如何利用用户间的最合适的相关性。以前的社交推荐方法通常是基于预定义的用户相关性而开发的。因此,对于一个具体的推荐任务,它们可能不是最优的。在这篇文章里,我们提出了一个名为概率关系矩阵分解(PRMF)的推荐方法,它可以自动学习用户相关性来提高推荐精度。在PRMF里,我们假设用户的潜在特征是服从矩阵变量正态(MVN)分布。此外,用户的正负相关性都可以用MVN分布的行精度矩阵来模拟。为了求解PRMF里的优化问题,我们提出了一个交替优化算法。最后,在四个真实数据上的大量实验证明了所提PRMF算法的效力。
论文链接:http://static.ijcai.org/proceedings-2017/0331.pdf
Online Multitask Relative Similarity Learning
Shuji Hao, Peilin Zhao, Yong Liu, Steven C. H. Hoi, Chunyan Miao
在线多任务相对相似度学习
郝书吉, 赵沛霖, 刘勇, 许主洪, 苗春燕
摘要:相对相似度学习(RSL)旨在通过由相对约束组成的数据来学习相似度函数。以前的大部分为RSL设计的算法是离线学习算法,所以在处理现实世界中的流式数据时会遭受极差的可扩展性。此外,这些现存算法经常被设计来为一个具体的任务学习一个单独的相似度函数。因此,它们在解决多任务学习问题时是次优的。为了克服这些缺陷,我们提出了一个可扩展的RSL框架,并命名为在线多任务相对相似度学习(OMTRSL)。具体来说,我们首先针对多任务相对相似度学习开发了一个简单有效的在线学习算法。然后,我们又提出一个主动学习算法来节省打标的成本。所提出的算法不仅享有极好的理论保证,也在现实数据集的实验上展现了其高效能和效率。
论文链接:https://www.ijcai.org/proceedings/2017/0253.pdf
以下两篇被主题为“AI Applications in E-Commerce”的Workshop收录
Solving a New 3D Bin Packing Problem with Deep ReinforcementLearning Method
利用深度强化学习解决新型三维装箱问题
作者:胡浩源 张晓东 王龙飞 徐盈辉
本文通过近些年被成功应用于组合优化问题的深度学习技术--Pointer Network来对物品的放入顺序进行学习和优化。基于大量实际数据构建和训练了深度强化学习网络,并对此网络的效果进行了检验,结果表明相对于已有的启发式方法,使用本文提出的深度强化学习方法可以获得大约5%的效果提升。
Life-stage inference in E-commerce: adynamic merging based approach
电子商务中的生命阶段推断:一种动态融合方法
作者:周中晟,张祎东,舒智超,邓玉明,王晓晴
为了提升用户购物体验,丰富用户资料并探索用户的潜在兴趣是有价值的。例如,我们应该对初生婴儿的妈妈展示尿布,对1到2岁宝宝的妈妈展示儿童服装,因为妈妈们会在特定阶段对购买这些商品感兴趣。我们设计了一种基于动态融合方法的生命阶段推断,可用于预测用户年龄并在电商推荐系统中使用。动态融合的关键是维护具有不同分类结论的多个概率分布,并在合适的时候对其进行更新。长期来看,只有有限个概率分布会被保留下来,我们可以根据这些分布对生命阶段进行推断。这样做的优点是无论对一个或是多个用户都能使用统一的生命阶段预测结构,并且可以识别消费者的短期偏好。
来源:阿里技术
原文链接
PS:想和更多人工智能大牛交流,加入云栖AI圈吧!