达摩院大模型技术交流会
阿里巴巴达摩院前沿自然语言处理预训练模型体系——AliceMind系统化揭秘,全方位了解其背景介绍、算法能力、工作成果、工程实践及业务落地应用。1.达摩院AliceMind算法团队专家亮相直播,带你深入走近VQA Challenge首超人类的大规模多模态预训练技术——AliceMind-MMU,了解其背后的技术工作及基于电商场景的落地案例;解读与阿里云计算平台PAI团队合作的最新成功——基于稀疏的大规模语言模型落地方案的的前沿进展和最佳实践。2.达摩院高级技术专家带你走进大模型落地的背后,从工程侧详细探讨超大规模语言模型落地过程中的体系建设。3.达摩院AliceMind团队 x 阿里云计算平台事业部合作业务落地结果首次发布,看基于预训练模型的QA生成算法如何在大数据场景的落地。讲师/嘉宾简介出品人:黄松芳 博士 达摩院 资深算法专家,深度语言模型体系AliceMind团队负责人。负责超大规模多模态预训练模型的技术研发和行业应用。英国爱丁堡大学博士,加入阿里巴巴之前,曾在IBM研究院工作10多年。嘉宾:徐海洋 达摩院 专家算法工程师个人简介:主要负责大规模多模态预训练工作,毕业于东南大学,曾就职滴滴AI LABS,在国际顶级会议ACL,EMNLP,IJCAI,SIGIR,InterSpeech等发表论文10多篇,参与开源项目AliceMind,DELTA。谭传奇 达摩院 算法专家个人简介:北航-MSRA联合培养博士生,2019年毕业后加入阿里巴巴达摩院,先后参与医疗NLP和语言模型方向研究,研究方向有信息抽取、阅读理解、语言模型等,目前负责阿里巴巴深度语言模型体系AliceMind中大规模语言模型(PLUG)的落地工作。曾在MS-MARCO、TREC PM、TREC CT等国际权威评测获得冠军,在ICLR、NeurIPS、ACL、EMNLP、NAACL、AAAI、IJCAI、WWW等国际会议发表论文20余篇。张志成 达摩院 高级技术专家个人简介:张志成,阿里巴巴达摩院机器智能高级技术专家,普渡大学硕士,专注人工智能领域的算法与工程落地,曾负责大型智能建筑项目中的能源优化决策系统的算法设计和平台系统研发,负责图像识别和视频追踪在图片与视频广告投放中的算法训练和相关系统设计,目前在达摩院负责nlp语言模型平台的建设和维护。管正雄 阿里云 高级算法工程师个人简介:专注于AIOps领域的算法研究与落地,感兴趣的算法方向有:时序异常检测、根因定位、NLP相关等。目前在阿里云计算平台大数据基础工程技术团队,以AIOps算法侧的角色为业务团队带来增益。
阿里研究院@从理论到应用:论道认知智能丨CCF C³活动 基于超大规模预训练模型的小样本和零样本学习
9月24日,CCF C³活动来到阿里研究院,齐聚来自各行业的企业CTO、高级技术人才和资深学者,共同探讨企业人工智能从感知智能向认知智能阶段发展的意义。 活动开始前,与会嘉宾参观了阿里巴巴集团北京展区,现场活动由CCF副秘书长、亿邦动力CEO王超主持。CCF副理事长、创新工场首席科学家、澜舟科技创始人周明做了开场致辞,并代表CCF为活动承办方阿里研究院颁发CCF C³活动承办单位感谢牌。 周明表示,CCF C³活动,希望加强企业界和企业界之间、企业界和学术界之间的沟通交流,让不同文化相互碰撞,互相取长补短。阿里研究院副院长安筱鹏在开场致辞中说,阿里巴巴既是商业的阿里,也是科技的阿里,致力于由商业和技术双轮驱动,成为的全球数字科技领先的公司。 苏中在主题报告中介绍了阿里在大模型技术领域的尝试。苏中指出,人的优势是可以举一反三,进行小样本,甚至零样本的学习;而机器要拥有这样的认知能力,就要通过海量数据来进行预训练。当模型的规模不断扩大,出现百亿、万亿参数规模的大模型技术,通过算力和海量数据,给计算机提升认知智能能力“打开了窗户”。