【杭州云栖·飞天技术汇企业应用专场】传统企业装上“智慧大脑” 看阿里巴巴如何实践AI赋能

简介:

“我们找了8位专业律师,和我们的AI机器人做了一个对比,我们的召回率与8位律师相当,但我们的准确率更高些”。

 

在不久前刚结束的杭州云栖大会上,来自阿里巴巴信息平台事业部的资深算法专家李波,正在向观众展示阿里巴巴的自动文书审核系统。目前这套系统在自动识别的准确度上已经达到98%以上,并在阿里内部法务场景中实践。

 

实际上,除了自动文书审核系统,人工智能在阿里巴巴智能HR、智能法务等多个领域,已经得到广泛应用。

 

究竟阿里巴巴是如何通过AI等技术手段,赋能组织,让企业顺利完成数字化转型的?在22日云栖大会的企业应用专场论坛上,李波为大家解开了阿里企业智慧大脑的神秘面纱。

 

345ee2267f8725035d66b2207aab17ec07ac55af

 

关于“企业大脑”,目前比较完整的一个表述由浪潮集团在2018年3月的全国两会上提出,即它是基于人工智能、大数据等新IT技术的融合而构建的企业智能化开放创新平台,辅助智能决择和业务自动化,驱动业务系统智能化,实现个性化、定制化、精细化的企业生产和服务。

 

“业务上云、数据整合、应用创新”是打造企业智慧大脑的三个步骤。结合阿里巴巴信息平台的实际经验,李波认为可以从下述三点最佳实践中着手:

 

1、打破信息孤岛。

这里的“信息孤岛”主要针对企业内部的数据不互通。造成原因一是业务发展的不均衡,以及技术系统发展的先后关系,造成两个系统在描述同一个业务概念的时候,使用了不同的数据模型,导致数据无法打通。二是大量的数据还存在于线下,比如纸质文件,法律文书、报销票据以及用户行为(如:会议室是否正在被使用)等。此时需要运用NLP,CV等AI技术,结合相对低成本的Iot设备,来打破信息孤岛,帮助我们提升效率。

 

2、深度融入应用。

以行业+AI的方式,将AI融入应用。传统行业的组织内部运作已经较为成熟,但是有大量的人工工作,效率较低,且容易出错。AI的介入,能够更好提升运营效率。

 

3、C2B迁移。

C类成功的AI经验迁移到B类应用中。李波认为,虽然C类与B类应用存在差异,但一些好的C类经验与技术实践能帮助B类场景中, ,有效地缩短企业智慧大脑的构建路径。而这可以是未来5-10年,建设企业智慧大脑的重点探索方向。

 

结合这三点最佳实践,阿里巴巴在智慧HR、智慧法务领域都已取得到一些成功尝试:

 

智能晋升辅助——AI减少人工主观偏差


在HR的晋升场景中,如果一个有一定规模的团队要去考虑人员晋升,通常会遇到如下两个问题:1、有哪些候选人有晋升潜力。2、不同候选人,谁更符合晋升标准。

 

以往主要是由主管与HR来给出答案,但这中间会存在不可避免的人工偏差。如果用AI提供辅助决策,就可能尽量减少人工带来的主观偏差。

 

6a7ebd069cc39864fa8c01e34ef1d06b7b21b119

 

基于阿里巴巴集团内部数据,从绩效和潜力、沉淀和分享、质量和产出、投入和效率这四个维度,阿里巴巴构建了一个客观的指标体系,并在这一体系中搭建机器学习模型,能对晋升做出辅助预判。

 

比如,某位候选人,他与晋升标准、与以往的晋升案例对比,他的晋升概率会有多少,以此来帮助主管或HR做决断。

 

目前智能晋升辅助系统的AI决策主要作用在提名和评审阶段。针对初级和中级职位,智能晋升辅助系统已经达到98%的预测准确率。并且能够覆盖40%的潜在晋升人群。对于阿里巴巴这样一个大的集团而言,这个数字对于企业效率的提升已经起到相当大的作用。

 

面试官评价模型——AI提升效率深入洞见


此外,阿里巴巴还为HR晋升工作创建了面试官评价模型。

 

面试官的面试技能和成熟度,直接决定了招聘的效率和效果。但不同于晋升辅助模型,面试官模型缺乏客观的历史数据。

 

对此,构建面试官评价模式时需要选择用主动学习的方式,将人工建模与机器建模结合。

 

186841246aedb50fe39715de9ba50b85762191f7

 

在人工建模阶段,深入引入专家经验,人工生成指向性规则指标。再通过对样本的人工标注结果,去反推数据进行调整,直到生成最终的面试官评价。

 

有了人工标注的数据后,再进入到机器建模阶段。在机器建模中,不仅能得到自动模型,还能从数据里挖掘特征,如:符合哪些特征的面试官,他有哪些倾向性。这些数据特征再反过来辅助人工建模与标注。

 

通过Active Learing,这一面试官评价模型在对面试官评价的准确度上能保持在90%以上,并且覆盖20%的面试官。虽然20%的覆盖数字本身可能不大,但它已经足够支撑招聘团队去针对面试官做出面试技能培训、复盘跟进等相应运营调整。

 

智能花名——AI催化有温度的组织文化


花名是阿里巴巴独特的文化,也是阿里这个有温度的组织文化体现。但由于每个员工花名的独一性,即使离职员工花名也会得到保留,所以新同学入职后发现取花名很难。

 

82a8f531a429dbab28b899c063211a8992d2d4ab

 

于是在新人取花名的场景中,AI提供了这样一个功能——智能花名。它可以随机推荐花名,也可以指定关键词去检索花名,甚至还可以基于描述、释义偏好来取名。例如,你希望花名中含有“在前面开路引导的人”的意义,智能花名系统就会推荐“先驱”、“先锋”、“开拓”等花名给你。智能花名系统上线以来,员工采纳率达到60%以上。

 

上述三个AI系统主要运用在HR领域。在法务领域,阿里巴巴也通过AI手段来处理部分日常工作。

 

自动文书审核——AI将重复繁冗的业务环节自动化


自动文书协议审核就是开头提到与8名专业律师PK的AI机器人。它能自动审核协议中存在的潜在风险,并给出建议。能进一步降低平台风险。目前,自动文书协议审核的识别准确率在98%左右,能检测出85%的违规内容。

 

cdc0e832555de1c2d317caafe8df75cf34966572

 

除了协议审核外,AI还能帮助进行合同形式的审核。包括合同文本内容一致性审核、合同金额正确性检查(如大写金额和小写金额是否一致)、条款完备性检查以及序号、错别字检查等。这些都是在日常工作中能够极大帮助法务人员,从日常大量繁琐工作中解放出来,专注到更有创造性的工作中去。

 

智能文书录入——AI让线上线下的信息无缝对接


大量法律文书,无论是合同文书,诉状,还是证据等,主要以纸质形式存在。怎样把纸质文件快速录入到系统中,是提升整个工作效率最关键的一环。

 

智能文书录入就为这一法务场景提供解决办法。它不仅能将线下文本自动转化到线上,更能自动提取录入关键信息。

 

119c42a8d1f9f33254fce3e1591c361ac0e865d0

 

纸质文件在完成扫描后,通过OCR识别出文本内容,同时通过成熟的NLP技术,对文本进行分析与信息抽取,提取出一些关键字段,例如甲方乙方等。同时,系统还能对条款进行些分类,比如条款属于哪些类型,又有哪些条款需要重点关注。目前文书抽取的准确率达到98%,条款分类的准确率在94%左右。

 

这些智能录入的文书信息,后续无论是做搜索的应用,还是BI统计应用,都非常有用。

 

智能合同搜索——AI让合同搜索更快速、准确和安全


法务同学在日常工作中的合同检索量较大,在这一场景中,智能合同搜索功能能做到毫秒级别的检索性能和检索响应,确保时效性。


b2ca2b29ec27dec9a995495ef97eb2c800db6d73

 

此外,合同检索对安全性和保密性要求极高,这套系统在开发和部署阶段,实现了一整套密态检索功能,能有效保障数据的安全性。

目前,针对法律文书的特点,系统还实现了定制化检索和排序的流程,使得整体检索相关度在90%以上。

 

企业智慧大脑还是比较新兴的一个领域,未来,阿里巴巴也将不断深化AI应用,实现企业的数字化转型。

相关文章
|
2月前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
7天前
|
人工智能
国家电网与阿里巴巴达成AI合作!
国家电网与阿里巴巴达成AI合作!
48 17
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
58 25
|
5月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【8月更文挑战第1天】在当今科技飞速发展的时代,AI已成为日常生活中不可或缺的一部分。神经网络作为AI的核心,通过模拟人脑中的神经元连接方式处理复杂数据模式。利用Python及其强大的库TensorFlow,我们可以轻松构建神经网络模型。示例代码展示了如何建立一个含有两层隐藏层的简单神经网络,用于分类任务。神经网络通过反向传播算法不断优化权重和偏置,从而提高预测准确性。随着技术的进步,神经网络正变得越来越深、越来越复杂,能够应对更加艰巨的挑战,推动着AI领域向前发展。
56 2
|
3月前
|
人工智能 自然语言处理 搜索推荐
【云栖实录】大模型驱动,开源融合的AI搜索产品发布
本文介绍了2024云栖大会上,阿里云发布的年度AI搜索产品详情。
214 8
|
3月前
|
机器学习/深度学习 人工智能 算法
Nature子刊:AI模型测大脑年龄,究竟哪些因素会加速大脑衰老?
【10月更文挑战第7天】《自然医学》杂志近期发布了一项研究,介绍了一种名为BrainAge的人工智能模型,该模型可预测个体的大脑年龄并分析影响大脑衰老的因素。研究团队来自美国加州大学旧金山分校,利用英国生物银行的近50,000名参与者的数据,发现高血压、糖尿病、肥胖、吸烟、饮酒、缺乏运动及遗传因素均与大脑衰老有关。尽管存在数据集限制等局限性,BrainAge模型仍为研究大脑衰老和相关疾病提供了重要工具。
74 1
|
4月前
|
人工智能 云栖大会 云计算
9.19-9.20 云栖工坊邀您亲手打造AI助手
9.19-9.20 云栖工坊邀您亲手打造AI助手
557 29
|
3月前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
阿里云瑶池在2024云栖大会上重磅发布由Data+AI驱动的多模数据管理平台DMS:OneMeta+OneOps,通过统一、开放、多模的元数据服务实现跨环境、跨引擎、跨实例的统一治理,可支持高达40+种数据源,实现自建、他云数据源的无缝对接,助力业务决策效率提升10倍。
|
4月前
|
消息中间件 人工智能 Cloud Native
|
4月前
|
数据采集 机器学习/深度学习 人工智能
云栖实录 | GenAI 时代 AI Infra 工程技术趋势与平台演进
本文根据2024云栖大会实录整理而成,演讲信息如下: 演讲人:林伟 | 阿里云智能集团研究员、阿里云人工智能平台 PAI 负责人;黄博远|阿里云智能集团资深产品专家、阿里云人工智能平台 PAI 产品负责人 活动:2024 云栖大会 - AI Infra 核心技术专场、人工智能平台 PAI 年度发布专场