SIGIR-2018-EASR workshop keynote,阿士比亚:阿里巴巴智能内容生成实践

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
智能开放搜索 OpenSearch向量检索版,4核32GB 1个月
简介: 研讨会由罗格斯大学计算机系张永锋老师、加州大学圣克鲁兹分校计算机系张奕老师、清华大学计算机系张敏老师共同主办,张永锋老师现场主持。

在刚刚结束的信息检索顶级会议SIGIR-2018中,阿里巴巴搜索事业部智能内容生成项目成果受到了学术界的关注,项目负责人清淞收到EASR-workshop keynote的邀请,参加了于2018年7月12日上午在美国安娜堡密歇根大学举行的第一届可解释性推荐与搜索研讨会(The 1st International Workshopon ExplainAble Recommendation and Search, EARS’2018)。研讨会由罗格斯大学计算机系张永锋老师、加州大学圣克鲁兹分校计算机系张奕老师、清华大学计算机系张敏老师共同主办,张永锋老师现场主持。

image.png

Pre-workshop

本次研讨会邀请了密歇根大学信息学院杰出教授Paul Resnick和阿里巴巴搜索事业部的清淞做学术界和工业界Keynote,同时邀请了来自澳大利亚RMIT大学的Mark Sanderson教授、来自UT Austin的Matthew Lease教授,和来自UNC Charlotte的Wlodek Zadrozny教授作为嘉宾,下图为pre-workshop的讨论合照:

image.png

由左到右:张奕、张敏、Wlodek Zadrozny、张永锋、Matthew Lease、Paul Resnick、Mark Sanderson、清淞

Keynote Session

阿里巴巴搜索算法事业部清淞以Shakespeare of Alibaba:Practice of Intelligent Recommendation Reason Generation in Alibaba做了产业主题报告,介绍了阿里巴巴在电商内容生成方面的工作和实践。

清淞keynote中分享的项目代号为“阿士比亚”,寓意是“阿里巴巴的莎士比亚”,期望阿士比亚这个智能写手像著名文学家莎士比亚一样,能够达到比较高的写作水平。项目最初在2017年双十一上线,生成了百万量级的智能推荐理由。下面是keynote分享过程和Keynote Slide截图。

image.png

image.png

image.png

Keynote Slide:

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.![image.png

image.png

image.png

image.png

image.png

Talk Session
研讨会同时邀请了来自澳大利亚RMIT大学的Mark Sanderson教授、来自UT Austin的Matthew Lease教授,和来自UNC Charlotte的Wlodek Zadrozny教授作为嘉宾,与做主题报告的Paul Resnick教授和清淞一起,在张永锋的主持下展开了关于可解释性推荐与搜索研究现状与未来发展的座谈会。座谈会嘉宾分别在学术研究和工业实践的角度分析了可解释性在信息检索和推荐系统中的重要性,在欧盟GDPR等新法律法规陆续出台的背景下,可解释性势必成为包括信息检索和推荐系统在内的众多智能系统必须关注的重要议题之一。座谈会也展望了可解释性推荐与搜索在问题、模型、评价和应用等层面上的未来重要研究课题。
image.png

Panel discussion(由左到右):张永锋、Wlodek Zadrozny、Paul Resnick、Mark Sanderson、Matthew Lease、清淞

此外,研讨会共录用了来自欧洲、中国、美国、日本、印度的7篇研究论文,在研讨会的最后,论文作者分别进行论文口头报告,介绍了可解释性在本文检索、推荐系统、新闻媒体、排序学习、话题模型等问题中的最新研究成果。

After Session

清淞分享的keynote受到了现场的很高的关注,研讨会中间两次break进行了接近1小时的讨论。阿里巴巴搜索事业部在搜索推荐、NLP等算法领域有着深厚的积累,同时拥有很好的数据和落地场景,希望能借此次机会与学术界促成更多的技术合作。

image.png

搜索算法团队是阿里巴巴集团的核心业务和核心算法团队,是拥有包括双十一在内的大规模数据场景实战经验的团队,更是一支不停追求技术边界突破和业务创新的团队,有着来自世界各地的优秀算法工程师,研究成果屡次获得内部大奖,并被主流媒体报道过,同时也和海内外一流高校和实验室有长期科研合作项目,发表过包括WWW,SIGIR,KDD,CIKM等会议在内的多篇顶级学术会议文章。

清淞所在的团队现在focus在国际化搜索&推荐业务,国际化业务一片蓝海,处于非常快速的发展期,我们热烈欢迎更多优秀的工程师能加入一起探索!目前有以下在招岗位,社招校招&实习生均可!(另外搜索事业部主要在杭州北京两地,清淞所在team全部在北京)

搜索事业部人工智能算法工程师:

岗位描述

  1. 主要负责电商搜索排序算法优化:利用电商大规模异构数据进行建模,通过Query理解、商品信息和商家理解来构建“用户意图知识图谱”,同时在用户行为上通过图表达,多目标学习,深度学习等算法建立实时用户感知模型并能自主学习的“用户行为知识图谱”,从而更好地落地在用户偏好预测、人群分类、个性化排序和推荐等业务中;
  2. 主要负责多场景协同优化技术的应用:利用多智能体机器学习和增强学习来解决包括搜索、推荐、广告、营销等多场景的联合优化问题和流量调控等问题,同时利用博弈论的思路建立更好的搜索排序机制避免流量作弊并优化流量资源的合理分配;
  3. 主要负责营销场景和新商业机制优化:通过对店铺、商品、分仓等多维度数据的建模来进行实时销量预测,从而指导商家做品类规划和营销计划,同时和供应链相结合,指导卖家入库和备货,结合流量端调控,提升供应链效率,降低卖家运营成本,达到卖家,买家和平台共赢。
  4. 主要负责交互式搜索和用户体验设计:交互式搜索提供一种智能人机交互的搜索体验,通过自然语言理解、用户意图理解、知识图谱、对话管理、问答搜索等技术和搜索引擎做多轮交互逐步明确搜索意图,获取更多购物知识,提升购物体验。
  5. 主要负责电商业务智能风控算法优化:通过大规模异构行为数据来构建覆盖搜索、推荐、广告、物流、金融的智能风控大脑,并通过基于图模式挖掘的深度学习方法来优化各种包括文本、图像、以及行为作弊的识别,并基于博弈论和对抗神经网络来建立有效的干预机制。

岗位要求

1、本科及以上学历,硕士博士优先,计算机、数学、控制论、信号处理、博弈论、运筹优化、统计学、信息安全等相关专业;有扎实的数理分析基础并有交叉领域研究经验的优先

2、熟悉常用数据挖掘和机器学习算法,特别是对各种人工智能系统等相关领域的应用问题有大量研究或者实践经验者优先,有实际成果并发表在国际顶级会议、期刊者优先。

3、熟练掌握Java,C++等常用的编程语言以及Python等脚本语言,有相关基于BSP、MPI、ParameterServer等大规模分布式计算框架开发经验,有基于TF、Caffe等深度学习算法开发经验或者相关研究背景的优先;

4、有良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力;良好的逻辑思维能力,积极主动的技术热情,和踏实勤奋的工作态度。

简历可投递至:qingsong.huaqs@taobao.com

我们期待你的加入!

相关文章
|
人工智能 编解码 自然语言处理
上交大&上海AI lab研发胸部X-ray疾病诊断基础模型,成果入选Nature子刊
上交大&上海AI lab研发胸部X-ray疾病诊断基础模型,成果入选Nature子刊
229 0
|
机器学习/深度学习 人工智能 大数据
【重磅】文娱技术喜提多篇ACM MM论文
2021ACM MM(ACM International Conference on Multimedia),阿里巴巴文娱技术共4篇论文被收录。研究成果分别是:视频修复、目标检测器、视频质量评估、情感计算 技术领域。
1101 0
【重磅】文娱技术喜提多篇ACM MM论文
|
4月前
|
机器学习/深度学习 运维 算法
|
6月前
|
机器学习/深度学习 运维 算法
大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW
近日,由阿里云计算平台大数据基础工程技术团队主导的四篇时间序列相关论文分别被国际顶会ICLR2024、ICDE2024和WWW2024接收。
|
机器学习/深度学习 人工智能 缓存
AI_Papers周刊:第五期
我们研究了语言模型中的上下文学习 (ICL) 如何受到语义先验与输入标签映射的影响。我们研究了两种设置——带有翻转标签的 ICL 和带有语义无关标签的 ICL——跨越各种模型系列(GPT-3、InstructGPT、Codex、PaLM 和 Flan-PaLM)。
183 0
|
机器学习/深度学习 人工智能 自然语言处理
AI_Papers周刊:第三期
我们介绍了 LLaMA,这是一组基础语言模型,参数范围从 7B 到 65B。我们在数万亿个令牌上训练我们的模型,并表明可以仅使用公开可用的数据集来训练最先进的模型,而无需诉诸专有和不可访问的数据集。特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。我们将所有模型发布给研究社区。
74 0
AI:2020年6月24日北京智源大会演讲分享之知识智能专题论坛——10:05-10:50 东昱晓 《Graph Representation Learning》
AI:2020年6月24日北京智源大会演讲分享之知识智能专题论坛——10:05-10:50 东昱晓 《Graph Representation Learning》
AI:2020年6月24日北京智源大会演讲分享之知识智能专题论坛——10:05-10:50 东昱晓 《Graph Representation Learning》
|
机器学习/深度学习 自然语言处理 算法
国际顶会OSDI首度收录淘宝系统论文,端云协同智能获大会主旨演讲推荐
大淘宝技术团队论文入选计算机系统领域顶级国际学术会议OSDI,这是淘宝系统论文首次入选该国际顶会,论文详解了阿里历经四年、自主研发的首个端到端、通用型、规模化产业应用的端云协同机器学习系统“瓦力”——Walle。OSDI特别邀请到的David Tennenhouse在大会主旨演讲中专门推荐了Walle系统,对其技术先进性和应用落地效果赞誉有加。目前,Walle 作为阿里机器学习的基础设施支持 30+APP上 的300+个算法任务。
506 0
国际顶会OSDI首度收录淘宝系统论文,端云协同智能获大会主旨演讲推荐
|
人工智能 分布式计算 大数据
Spark + AI Summit 2020 中文议题有奖征集
北美 Spark + AI Summit 2020 盛会在即,Apache Spark 中国技术交流社区在此诚邀各位,代表国内开发者选择您最希望听到的主题,届时社区将联合国内顶尖技术专家一一展开中文形式分享。
Spark + AI Summit 2020 中文议题有奖征集