阿里巴巴数据技术及产品部资深算法专家杨红霞在2017杭州云栖大会中做了题为《阿里巴巴人工智能驱动大数据》的分享,就复杂的大数据,全域实体识别,自动化标签生产系统做了深入的分析。
https://yq.aliyun.com/download/1024?spm=a2c4e.11154804.0.0.7d466a79eUm0kg
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
杨红霞在2017杭州云栖大会上的分享《阿里巴巴人工智能驱动大数据》深入探讨了阿里巴巴如何利用先进的人工智能技术来处理和优化大数据管理与分析,这对于理解阿里云在大数据处理方面的策略和技术进步非常有帮助。根据您的描述,分享内容主要涉及以下几个关键点:
复杂的大数据处理:阿里巴巴作为全球领先的电商平台,每天处理海量的数据。杨红霞的分享可能包括了阿里巴巴如何设计高效的数据处理架构,比如使用分布式计算框架(如MaxCompute,原名ODPS)来处理PB级别的数据,以及如何通过算法优化提升数据处理速度和效率。
全域实体识别:这是指在全网范围内对特定实体(如商品、用户、品牌等)进行精准识别和统一管理的技术。阿里巴巴可能运用自然语言处理(NLP)、知识图谱构建等AI技术,实现跨平台、跨数据源的实体识别和链接,为个性化推荐、风险控制等应用提供支持。
自动化标签生产系统:标签是大数据分析中用于描述数据特征的关键元素,自动化标签生产能够极大地提高数据处理的效率和准确性。这一系统可能结合机器学习模型自动分析数据,生成结构化的标签体系,支持更精细化的用户画像构建、内容分类和智能搜索等功能。
对于希望深入了解这些技术和实践的用户,可以通过提供的链接下载相关资料。此外,阿里云官网也提供了丰富的文档、教程和案例研究,涵盖了大数据处理、机器学习、数据仓库、实时计算等多个领域的产品和服务,如MaxCompute、DataWorks、PAI(Platform of Artificial Intelligence)等,这些都是将理论转化为实际应用的重要资源。