明略科技HAO图谱Open API:开放企业级知识图谱构建能力

简介: 首个语音实时生成图谱的企业级知识图谱开发工具包。

由深度学习掀起的这波 AI 浪潮极度依赖数据,经过 10 年的发展,深度学习在一些场景应用上已经面临瓶颈。业内有一种声音得到了大量认同:人工智能的进一步发展与突破,需要从感知智能向认知智能的突破,知识图谱能有效从数据中挖掘出知识,以更具可解释性的 AI 指导人类在更多复杂场景中的智能决策和行动。


7 月 11 日,在 2020 WAIC 世界人工智能大会上,明略科技 HAO 图谱,作为目前世界上第一个语音实时生成图谱的企业级知识图谱开发工具包,首次公开亮相,成功入围了大会最高奖项 SAIL 奖(Super AI Leader)TOP30 的项目及 2020 年度 SAIL 榜单。


明略科技首席科学家、明略科学院院长吴信东在开发者日:开发 · 开源 · 社区主题论坛上正式宣布 HAO 图谱依托国家新一代人工智能开放创新平台开放 Text2KG API 接口,赋能开发者和企业级用户。


负责 HAO 图谱具体研发工作的是明略科学院知识工程实验室,我们与实验室主任张杰博士进行了交流,他向我们介绍了明略科技的 HAO 图谱技术及应用落地。


HAO 图谱,源自于 2018 年明略科技提出的 HAO 智能理论框架。HAO 智能旨在集成人类智能(HI)、人工智能(AI)和组织智能(OI),打通感知、认知和行动系统,帮助企业和组织实现智能化发展。其中,HAO 图谱属于认知系统的范畴。


HAO 图谱,可以独立运行,也可交付给企业技术团队进行二次开发,核心模块包括语音流监听,语音转文本,标点预测,口语顺滑,文本补全,实体关系抽取,实体对齐,以及图谱话题切换。


微信图片_20211204005034.png


具体来说,HAO 图谱的输入为一维的文字序列或语音流,系统工作时分为如下几步:

  1. 逐句翻译,形成大图:首先将输入序列逐句的做实体识别和关系抽取,绘制成图结构,每新增一句,就在原有的图结构上增加新节点和新边;
  2. 篇章摘要,找到重点:当整段文本或语音输入结束后,再在篇章级大图谱上,根据节点的语义、图结构、位置等特征识别出重点节点和边;
  3. 关联背景知识:将重点节点和关系映射到后台的领域知识图谱上,利用领域知识图谱扩展其语义信息。领域图谱包括:由大量实例组成的数据图谱、由因果关系组成的因果图谱、由领域本体结构和领域词表组成的语义工具;
  4. 图谱增强的应用:针对领域内的特定场景需求,基于图谱做可视化交互、分类、检索、推荐、文本生成等特定任务。


目前 HAO 图谱开放的 Text2KG API 接口,提供了文本转图谱的能力,但后台还做了一些面对 PDF、PPT、word 等半结构化文档的信息抽取接 


知识图谱技术在产业界正经历着应用的高速增长,学术领域前沿成果与实际落地应用场景间依然存在着巨大的鸿沟,设计、开发、部署一套知识图谱系统,会面临数据标注、模型训练调优、高并发高可用等一系列问题。「目前业内仍缺少一个工业级的稳定工具,HAO 图谱是第一个语音实时生成图谱的企业级知识图谱开发工具包。」张杰表示。


在实际的知识图谱构建流程中,标注数据、训练模型需要花费大量时间。而 HAO 图谱很大程度上解决了上述问题,让数据分析师或者是建模人员集中精力在业务层,而底层的收集数据、标注数据、训练模型、数据抽取以及与后台关联可以通过调用 HAO 图谱 Text2KG API 完成,避免了大量的重复工作。「根据实际的企业用户使用情况来看,可以帮助开发者节约 60% 左右的时间。」张杰介绍。

HAO 图谱所提供的模型,既包含通用模型,也包含特定领域的模型,如汽车、奶粉、美妆等。通过 API 接口,使用已经训练好的开放域模型和特定领域模型,开发者可以集中精力在使用知识图谱解决实际的业务问题上。


知识图谱的应用涉及可视化、分类、检索、推荐和生成。目前,HAO 图谱已经被广泛应用在社交舆情分析、销售技能培训、金融交易反欺诈、案情研判、设备维护、城市及园区管理等不同场景。


在推荐领域,将领域知识有效融入算法,提高推断准确率一直是研究的难点之一。知识图谱,可将人类专家经验和规则,以及大量来自互联网、各个产业生产中获得的数据,有机结合,通过对不同实体(节点)之间关系的进行分析,获得洞察。「知识图谱蕴含一定的可解释性,因果关系相对比较明确,这一特点让它在金融、轨交、电力、公共安全等行业中得以较快落地。」


在社交媒体舆情分析场景中,基于知识图谱,可以把用户产生的评论,与后台已有的品牌数据结合,对产品特性进行观察,分析特定维度的用户舆情走势,随后把这些结果整合到 BI 系统,为运营人员提供用户需求洞察。在此基础之上,实现千人千面的个性化广告。


在智能导购场景中,比如,销售人员通过佩戴明略的智能工牌,在保障用户隐私和数据安全的前提下,将销售对话转为文字,进行话题分类,形成一个话题转移的知识图谱,计算出话题之间转移的概率,帮助销售人员复盘,分析流单的主要环节,改善话题转移和引导,提高成单率。


总之,HAO 图谱可以把企业数据按照业务逻辑抽象为陈述性知识或过程性知识,生成数据洞察以更易使用的方式为业务服务。「通过历史数据的分析和行业专家先验知识的输入,知识图谱可以很大程度上把行业知识复现出来,并实现能力的复用,明略科技能够在历史数据达到 10PB 级、日均增量数据超过 10TB 的环境下进行数据价值的挖掘,实现毫秒级的预测性分析,结合行业知识图谱形成决策和行动。」


目前,在企业智能化服务领域,明略科技已成长为一家明星公司。去年 8 月,明略科技成为第二批「国家新一代人工智能开放创新平台」建设单位,以开放、创新、共享为基本原则,持续建设软件与硬件平台、开源社区平台、培训平台,构建人工智能众创平台和标准验证实验室,设立人工智能产业基金,全面打造平台生态体系。HAO 图谱 Text2KG API 已在明略科技国家新一代人工智能开放创新平台官网上线。

文为机器之心报道,转载请联系本公众号获得授权

✄------------------------------------------------

相关文章
|
1月前
|
Java API 数据库
构建RESTful API已经成为现代Web开发的标准做法之一。Spring Boot框架因其简洁的配置、快速的启动特性及丰富的功能集而备受开发者青睐。
【10月更文挑战第11天】本文介绍如何使用Spring Boot构建在线图书管理系统的RESTful API。通过创建Spring Boot项目,定义`Book`实体类、`BookRepository`接口和`BookService`服务类,最后实现`BookController`控制器来处理HTTP请求,展示了从基础环境搭建到API测试的完整过程。
42 4
|
1月前
|
Java API 数据库
如何使用Spring Boot构建RESTful API,以在线图书管理系统为例
【10月更文挑战第9天】本文介绍了如何使用Spring Boot构建RESTful API,以在线图书管理系统为例,从项目搭建、实体类定义、数据访问层创建、业务逻辑处理到RESTful API的实现,详细展示了每个步骤。通过Spring Boot的简洁配置和强大功能,开发者可以高效地开发出功能完备、易于维护的Web应用。
56 3
|
6天前
|
SQL 缓存 测试技术
构建高性能RESTful API:最佳实践与避坑指南###
—— 本文深入探讨了构建高性能RESTful API的关键技术要点,从设计原则、状态码使用、版本控制到安全性考虑,旨在为开发者提供一套全面的最佳实践框架。通过避免常见的设计陷阱,本文将指导你如何优化API性能,提升用户体验,确保系统的稳定性和可扩展性。 ###
39 12
|
6天前
|
存储 SQL API
探索后端开发:构建高效API与数据库交互
【10月更文挑战第36天】在数字化时代,后端开发是连接用户界面和数据存储的桥梁。本文深入探讨如何设计高效的API以及如何实现API与数据库之间的无缝交互,确保数据的一致性和高性能。我们将从基础概念出发,逐步深入到实战技巧,为读者提供一个清晰的后端开发路线图。
|
3天前
|
JSON JavaScript API
深入浅出Node.js:从零开始构建RESTful API
【10月更文挑战第39天】 在数字化时代的浪潮中,API(应用程序编程接口)已成为连接不同软件应用的桥梁。本文将带领读者从零基础出发,逐步深入Node.js的世界,最终实现一个功能完备的RESTful API。通过实践,我们将探索如何利用Node.js的异步特性和强大的生态系统来构建高效、可扩展的服务。准备好迎接代码和概念的碰撞,一起解锁后端开发的新篇章。
|
5天前
|
网络协议 API
检测指定TCP端口开放状态免费API接口教程
该API用于检测目标主机指定TCP端口是否开放,适用于检测连通状态等场景。支持指定大陆、美国、香港等检测节点。请求地址为 `https://cn.apihz.cn/api/wangzhan/port.php`,支持POST和GET请求方式。请求参数包括 `id`、`key`、`type`、`host` 和 `port`。返回参数包含检测结果和状态码。示例请求:`https://cn.apihz.cn/api/wangzhan/port.php?id=88888888&key=88888888&type=1&host=49.234.56.78&port=80`。
|
6天前
|
存储 前端开发 搜索推荐
淘宝 1688 API 接口助力构建高效淘宝代购集运系统
在全球化商业背景下,淘宝代购集运业务蓬勃发展,满足了海外消费者对中国商品的需求。掌握淘宝1688 API接口是构建成功代购系统的關鍵。本文详细介绍如何利用API接口进行系统架构设计、商品数据同步、订单处理与物流集成,以及用户管理和客户服务,帮助你打造一个高效便捷的代购集运系统,实现商业价值与用户满意度的双赢。
|
8天前
|
JSON 缓存 API
构建高效RESTful API的最佳实践
【10月更文挑战第34天】在数字时代的浪潮中,后端开发扮演着至关重要的角色。本文将带你深入探索如何构建高效的RESTful API,从设计原则到实际编码技巧,再到性能优化和错误处理,我们将一一解锁这些技能。你将学会如何打造一个既优雅又强大的后端服务,让你的应用程序在激烈的市场竞争中脱颖而出。那么,让我们一起踏上这段精彩的旅程吧!
23 2
|
16天前
|
前端开发 关系型数据库 API
深入浅出后端开发——从零到一构建RESTful API
本文旨在为初学者提供一个关于后端开发的全面指南,特别是如何从零开始构建一个RESTful API。我们将探讨后端开发的基本概念、所需技术栈、以及通过实际案例展示如何设计和实现一个简单的RESTful API。无论你是完全的新手还是有一定编程基础的开发者,这篇文章都将为你提供实用的知识和技巧,帮助你在后端开发的道路上迈出坚实的一步。
|
17天前
|
缓存 负载均衡 安全
后端开发的艺术:构建高效、可扩展的API
在现代软件开发中,后端开发扮演着至关重要的角色。它不仅负责处理数据存储、业务逻辑和安全性,还需要提供高效、可扩展的API供前端和其他服务使用。本文将深入探讨后端开发的关键概念和技术,帮助读者了解如何构建高效、可扩展的API,并提供一些实用的建议和最佳实践。