2017年的第一场顶会,AI 产业巨头都带来了哪些技术干货

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介:

美国西部时间2月4号到8号,AAAI 2017 在旧金山举行。随着 AAAI越来越国际化,在本届会议上,出现了更多的中国面孔。除了 IBM、Google、Facebook、Uber 等外国公司,国内百度、腾讯、华为、小 i 机器人等公司也参与了会议,其中复旦大学与小 i 机器人合作的两篇论文被大会录用。


大会首日,百度、领英、IBM、Uber、Google、Facebook 等企业分别分享了各自的最新技术和研究观点。从各家的分享内容综合来看,关于“道”的探讨更大于“术”,大家更注重 AI 发展的逻辑思考,而不是具体的某一项技术或应用。以下是大会首日各企业分享的干货摘要。 


谷歌大脑首席科学家:机器人研究中的机器学习


代表谷歌做技术分享的是谷歌大脑首席科学家、负责谷歌机器人研究项目的 Vincent Vanhoucke。尽管深度学习给很多应用领域带来了更好的效果,但是 Google 觉得在机器人领域,机器学习算法的应用仍然很少。这是因为与图像识别、文本处理等应用不同,要控制机器人的行为,不但需要学习,其反馈系统同样重要。 


机器人手臂随机抓取物体的实验为例:


  • 强调在学习过程中并没有任何假设信息(Assumption),于是学习过程没有任何限制;

  • 通过多个“并行手臂”实验,彼此共享学习经验从而加速学习过程;

  • 对于已知机械结构的手臂,学习经验的共享和传递是可靠的。


听众对于“No assumption”的关注很多,其中一位观众的问题指出如果假设信息可以作为先验知识添加到学习模型中,则可能比没有假设信息更能加速学习收敛。


Google 虽然认为机器学习算法不够多,但不可否认的是机器学习相比过去更容易研究和突破,因为不论是方法论还是硬件,现在都比以前优越很多。


Facebook AML 负责人:大规模设计AI应用于日常生活


Facebook 应用机器学习实验室负责人 Joaquin Quinonero Candela 分享了解决问题之道:专注于当前的需求任务,实施并快速改进,而并非直接追求完美。


Applied Machine Learning (AML) 实验室开发的学习系统可以应用在图像、文本、语音等方面。以图像和视频理解平台 Lumos 为例,通过调整优化图像标签而重新训练的模型,可以改善其图像识别的效果并得到更多高级的应用。比如,不仅仅停留在图像表面的内容表述,而是根据图片人物和背景推断人物的活动和情绪等;或者当用户搜索的关键字不在图像的相关表述中时,仍然能通过该模型搜索得到图片;对于视频文件进行实时分类处理等。 


为了更好将不同任务的结果进行更好的匹配,Lumos将某一任务过程和结果按照计算量/识别精度进行细化,使得后续的不同任务可以分别对应到不同细化层面,从而在计算量和识别精度中寻找平衡点。


Facebook图像识别平台 Lumos 是目前最智能的图像搜索工具之一,因为它能够读懂照片,可根据图片内容进行搜索,而不是依靠已有的标签,而这得益于深度学习的进步。可以想象,这种技术未来的价值不可限量,如反垃圾信息、自动图像抓取等。


百度副总裁王海峰:百度的自然语言处理


百度认为自然语言特别是母语是人类进行思考的载体,因此 NLP 是让机器具备人类思考和理解能力的重要技术。


百度副总裁王海峰演讲现场


百度的 NLP 以大数据、机器学习和语言学为基础,结合知识图谱(包括 Entity graph,Intent graph 和 Attention graph),在语言理解和语言生成方面有重要应用,并形成问答、机器翻译和对话等应用系统。其 NLP 平台拥有过 20+ NLP 模块,每天的请求数量超过1000亿次。 


具体来说,Entity graph 用于实现复杂关系的推理,Attention graph 应用在文档理解方面以改善推荐系统,Intent graph 则应用于对话系统中。依存句法分析、基于深度学习的语义理解大幅度改善了查询理解的效果。在语言生成领域,百度列举了新闻写作、篮球评论、中文作诗等应用实现。


人机交互的方向是自然语言的方式,但自然语言处理是人工智能中最为困难的问题之一。相比其他公司,在 NLP 领域百度拥有得天独厚的用户和数据优势,海量的交互和用户行为,以及知识库可使百度保持强劲的竞争力。


领英Deepal Agarwal:大规模创造专业机会的AI


领英强调 AI 技术未来可能给更大规模范围的用户提供职业机会。AI 技术不仅仅为用户提供职业信息,还可以就各种职业问题寻求帮助,同时在全球范围内协调技能差距。


领英重点强调了其面临的两大问题:推荐和搜索。在推荐问题上,借助机器学习来优化短期推荐系统算法并最终实现长期目标;在搜索问题上,首先通过显性或隐性线索来推测用户意图,基于用户特征和推荐类别特征对搜索答案进行排序并输出。


领英的大量原始数据来源于用户,而基于人工智能的分类方法将对数据进行提炼优化。用户彼此间建立的联系不仅为领英提供更多数据,同时也将通过领英获取更多价值。


此外,领英还介绍了基于领英自主开发的 Photon Machine Learning (Photon ML) Library的 GAME - Generalized Additive Mixed Effect Model。还指出,虽然深度学习在很多应用中有重要作用,但是在实际应用中深度学习并非唯一的途径。


对于招聘者和求职者来说,更精准的结果和更佳的匹配度就是最好的服务体验。单从这一点来说,领英所强调的推荐和搜索问题正是求职平台上的关键痛点,借助AI技术改善平台服务,相信将是所有社交化招聘网站所关注的方向。


IBM:应对复杂状况的AI


IBM 的 Michael Withbrock 在演讲中指出,一般认为需要解决的问题可以分为两种:对于可表述的一致性问题,一般都可通过编程来实现;对于难于表述的多样化问题,只有少部分可以通过人工完成,而那些需要机器学习和推理的问题,则需要寻求更好的表示和计算模型。 


IBM 研究中心的 Michael Withbrock分享研究成果


针对这个问题,IBM 提出超越数据、程序以及任务限制的模型:基于组合理论(compositional theory),利用符号来表示问题的显性部分;利用变量的统计模型表达隐形部分。这种模型可用以解决需要机器学习和推理来完成的大多数多样化问题。


IBM 强调了符号主义的重要性,认为知识表达、逻辑在解决复杂问题中非常重要。基于逻辑的传统知识表示值得引起我们的重新思考(Rethink)。IBM在此方面的研究优势是从计算硬件的堆栈层面对机器学习算法进行近似,从而加速运算效率。


IBM 任何时候都是个技术主义者,而且能够在诸多领域产生了巨大的应用价值,比如在医疗方面。此次,他们提出超越数据、程序以及任务限制的模型,目的是提高机器学习和推理的效率和结果,让机器更好地理解人类并帮助人类。


Uber AI 实验室主任:人工智能局限性以及对通用AI的需求


Uber AI 实验室主任、Geometric Intelligence 创始人兼CEO Gary Marcus 在会上做了分享。Marcus 认为,深度学习并非是“万能药”,目前可以胜任的任务也相当有限。未来如何提取常识信息是重要且具有挑战性的,尽管现在有一些众包方案试图解决此类问题,但终究无法遍及全部常识,这些常识对于行动判断是至关重要的。


尽管深度学习在图像识别方面带来了巨大的革命,但是在复杂的实际应用情况下,如模糊视线中的物体识别等,仍有待改善。由此给 Uber 带来的问题是,无人车可能只是“会开车”,但并非能“安全行驶”。


我们一般认为Uber是一家平台公司,而非技术公司,但实际上Uber正在努力成为一家技术性企业因此他们不仅关注 AI 技术如何服务出行行业,也正在发展自己的人工智能技术力量,他们的目标是像谷歌、facebook 等公司一样。


复旦&小 i 机器人:聚焦机器自然语言理解的分类体系


复旦大学肖阳华博士带队的研究小组与小i 机器人合作的 Graph-Based Wrong IsA Relation Detection in a Large-Scale Lexical Taxonomy《基于图模型的大规模分类体系中的错误检测》和 On the Transitivity of Hypernym-Hyponym Relations in Data- Driven Lexical Taxonomies《数据驱动的大规模分类体系中上下位关系的传递性》两篇论文被大会收录,并做口头报告。

 

复旦研究小组现场宣读论文


自然语言理解是实现人工智能的关键,而分类体系在机器自然语言理解中不可缺少。两篇论文从不同的角度对大规模分类体系进行了深度探讨。


其中《基于图模型的大规模分类体系中的错误检测》主要研究如何提升自动构建的大规模知识库的质量:知识库在人工智能中起着重要的作用,其中,不管是人工构建的还是自动构建的知识库都获得了较多关注。相对于人工构建的知识库,自动构建的知识库规模更大,覆盖更广,但常包含更多的错误。该研究小组关注于包含isA关系的分类体系知识库,他们发现这些分类体系中往往存在环,而这些环经常是由于错误的isA关系导致的。从这个发现中,论文提出了两种模型用于从环中找出错误的isA关系。第一个模型通过在分类体系中提取DAG子图来消除其中的环,而第二个模型利用对分类体系中的结点定义层级来消除环。目前,已经在最先进的自动构建的分类体系Probase上实现了这两个模型。在处理了数千万关系以后,以91%的准确率消除了7.4万条错误关系。


《数据驱动的大规模分类体系中上下位关系的传递性》研究分类体系中的基础关系——上下位关系。


近几年研究人员构建了许多大规模的从语料自动抽取并构建的分类体系。这些分类体系包含了词汇之间的上下位关系(hypernym-hyponym)。上下位关系使得机器具备泛化能力,可广泛用于诸如实体分类、推荐等应用。论文聚焦于上下位关系的一个重要特性:传递性的判定问题。研究者发现,与人工构建的小规模分类体系和本体库不同,在大规模的自动构建的分类体系中,传递性并不总是成立。因此,他们提出了一个有监督方法来判定一个大规模自动构建的分类体系中传递性是否成立。基于这一判定方案,他们进一步利用传递性推断来发现分类体系中缺失的上下位关系。研究团队通过大量实验验证了相关模型与方法的有效性,并为当前现有的分类体系补全了近4百万缺失的上下位关系。


文章转自新智元公众号,原文链接

相关文章
|
6天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
38 3
|
16天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
119 59
|
4天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
66 11
|
10天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
55 4
|
9天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
14天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗健康领域的应用与挑战####
本文旨在探讨人工智能(AI)技术在医疗健康领域的创新应用及其面临的主要挑战。通过深入分析AI如何助力疾病诊断、治疗方案优化、患者管理及药物研发,本文揭示了AI技术在提升医疗服务质量、效率和可及性方面的巨大潜力。同时,文章也指出了数据隐私、伦理道德、技术局限性等关键问题,并提出了相应的解决策略和未来发展方向。本文为医疗从业者、研究者及政策制定者提供了对AI医疗技术的全面理解,促进了跨学科合作与创新。 ####
|
12天前
|
人工智能 算法
AI技术在医疗领域的应用及其挑战
【10月更文挑战第31天】本文将探讨AI技术在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念开始,然后详细介绍其在医疗领域的应用,包括疾病诊断、药物研发、患者护理等方面。最后,我们将讨论AI技术在医疗领域面临的挑战,如数据隐私、算法偏见等问题。
|
12天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。

热门文章

最新文章