微软这项黑科技能让 AI 更好地理解人类交流

简介:

AlphaGo 在上半年的火热,让越来越多的人记住了 AI,即“人工智能”,这一崭新技术。不过,实际上,当我们现在讨论人工智能时,大多数情况是指“弱人工智能”。

为此,我们也不得不正视一个事实,当前的人工智能更多的是针对某个具体的问题,发展对应的算法和技术。有人称之为“拼图式”的工作方法:先做出了视觉模块、再拼上语音模块、推理模块——把每个子领域的功能做好,然后再组合出一个完整的智能系统出来。

随着人工智能拼图不断趋于完整,那么计算机真的能像人类一样智能吗?

当前,人工智能可能能轻而易举的战胜一个三四十岁经验丰富的世界顶尖棋手,但是它的学习能力以及完成一般任务的能力也可能都远不及一个三四岁的孩童。

image

这个问题的答案可能是“常识”——理解是万物的基础。

针对这个问题,微软亚洲研究院正式发布 Microsoft Concept Graph 知识图谱和 Microsoft Concept Tagging 模型,用于帮助机器更好地理解人类交流并且进行语义计算。Microsoft Concept Graph 是一个大型的知识图谱系统。其包含的知识来自于数以亿计的网页和数年积累的搜索日志,可以为机器提供文本理解的常识性知识。

苹果是什么?

人们在正式上小学、初中接受系统性教育开始,已经早早地开始了学习的过程。这种与生俱来的本能能让你进入小学之前已经了解诸如“糖是甜的食品”、“水是一种液体”这一类基础的概念,并且随着年龄的增长,这种并不属于某个专业领域的开放性常识也在人们的认知中日积月累,并不断丰富。

image

image

微软亚洲研究院今天发布的 Microsoft Concept Graph 就在试图让计算机复制这些常识性概念,其核心知识库包含了超过 540 万条概念。

除了包含一些被绝大部分通用知识库包含的概念,例如“城市”、“音乐家”等,Microsoft Concept Graph 还包含数百万长尾概念,例如“抗帕金森治疗”、“名人婚纱设计师”、“基础的水彩技巧”等,而这些概念在其他的数据库中很难被找到。除了概念,Microsoft Concept Graph 同样包含了大量数据空间(每条知识概念都包含一系列的实体或者子概念,例如“太阳系”底下可能就会包括“水星”、“火星”、“地球”等等)。

苹果是甜的

当你看到“苹果是甜的”这句话时,你几乎可以肯定这里的“苹果”指的是我们最常见的那种水果。在这几毫秒的时间里,你触发的是“根据上下文语境确定语义”这一技能。微软亚洲研究院的研究员们同样也为计算机点亮了这棵技能树。

image

Microsoft Concept Tagging 模型可以将文本词条实体映射到不同的语义概念,并根据实体文本内容被标记上相应的概率标签。例如“微软”这个词可以被自动映射到“软件公司”和“科技巨头”等概念,并带有相应的概率标签。这个模型让计算机拥有常识性的计算能力,让机器“了解”人类的意识,从而让机器可以更好地理解人类的文本交流。具体来说,概念模型根据人类的概念推理将实体或者短语映射到大量自动习得的概念空间(向量空间)。这种映射关系是人类和机器都可以理解的。因此该模型提供了文本理解所需的文本概念映射、短语语义化理解等功能。

Microsoft Concept Tagging 模型区别于以往常见的文本推理模型的根本区别是他是基于网络之上的一个推理模型,将文本映射到一个显式的知识空间,将文本概念化。

理解是万事万物的基础

“我们想做的,是让计算机能够更好地理解人类。”现负责 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的微软亚洲研究院资深研究经理闫峻博士说,“理解是万事万物的基础,我们用计算机抓取过去这些不成文的开放领域的常识,能够帮助计算机更具象地了解这个世界。”

谈及 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的下一步计划,闫峻博士表示目前该模型暂只能支持英文,还要和高校合作完成中文的支持工作。在完成中文的知识库构建之后,再逐步扩展到多语言版本。其次,人类的语言还涉及到比喻、夸张和玩笑等高层次跨领域的抽象表达方法,这也是接下来需要让机器不断学习的方向。最后,从短文本的理解到长文本的理解,如理解两个完全不同的故事,但语义层面在表达同样的道理,也是他们接下来不断努力的方向。

目录
相关文章
|
12月前
|
人工智能 自然语言处理 监控
基于DeepSeek R1改进的AI安全模型!MAI-DS-R1:微软开源AI安全卫士,敏感话题响应率高达99.3%
微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型,通过后训练优化将敏感话题响应率提升至99.3%,同时将有害内容风险降低50%,保持原版推理能力并增强多语言支持。
1343 3
基于DeepSeek R1改进的AI安全模型!MAI-DS-R1:微软开源AI安全卫士,敏感话题响应率高达99.3%
|
12月前
|
机器学习/深度学习 存储 人工智能
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研
Qlib是微软亚洲研究院推出的开源AI量化投资平台,提供从数据处理、模型训练到组合管理的全流程支持,内置高性能数据基础设施和多种机器学习模型。
4714 87
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研
|
人工智能 自然语言处理 数据可视化
Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表
Data Formulator 是微软研究院推出的开源 AI 数据可视化工具,结合图形化界面和自然语言输入,帮助用户快速创建复杂的可视化图表。
1308 10
Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表
|
12月前
|
存储 人工智能 JSON
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
A2A是谷歌推出的首个标准化智能体交互协议,通过统一通信规范实现不同框架AI智能体的安全协作,支持多模态交互和长时任务管理,已有50多家企业加入生态。
945 0
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
|
机器学习/深度学习 人工智能 搜索推荐
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
BioEmu 是微软推出的生成式深度学习系统,可在单个 GPU 上每小时生成数千种蛋白质结构样本,支持模拟动态变化、预测热力学性质,并显著降低计算成本。
762 2
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
|
Web App开发 机器学习/深度学习 人工智能
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
Weebo 是一款基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术的 AI 语音聊天机器人,支持实时语音交互和多语言对话,适用于个人助理、娱乐互动和教育辅导等多种场景。
1325 17
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
|
人工智能 运维 Prometheus
AIOpsLab:云服务自动化运维 AI,微软开源云服务 AI 框架,覆盖整个生命周期
AIOpsLab 是微软等机构推出的开源框架,支持云服务自动化运维,涵盖故障检测、根本原因分析等完整生命周期。
707 13
AIOpsLab:云服务自动化运维 AI,微软开源云服务 AI 框架,覆盖整个生命周期
|
人工智能 安全 数据中心
D1net阅闻 | 微软CEO对话特朗普和马斯克:豪掷800亿美元建AI数据中心
D1net阅闻 | 微软CEO对话特朗普和马斯克:豪掷800亿美元建AI数据中心
|
缓存 人工智能 自然语言处理
微软发明全新LLM语言,AI智能体交互效率翻倍!
微软发布DroidSpeak技术,优化大型语言模型(LLM)间的通信,显著提升AI智能体交互效率。该技术通过嵌入缓存和键值缓存重用,减少预填充延迟,降低高达50%的延迟,同时保持高质量生成。DroidSpeak适用于多种AI任务,提高协作效率,但在资源受限环境和处理模型差异性方面仍面临挑战。
492 3
|
机器学习/深度学习 人工智能 自然语言处理
Magma:微软放大招!新型多模态AI能看懂视频+浏览网页+UI交互+控制机器人,数字世界到物理现实无缝衔接
Magma 是微软研究院开发的多模态AI基础模型,结合语言、空间和时间智能,能够处理图像、视频和文本等多模态输入,适用于UI导航、机器人操作和复杂任务规划。
843 2