AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite-阿里云开发者社区

开发者社区> 超努力的写代码> 正文

AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

简介: 自动生成 PPT,自动图片转文字 + 翻译,甚至自动辅助写文章…… 办公自动化的未来已来。
+关注继续查看


WPS 是个已有超过 30 年历史的办公软件,但它最近的用户数量增长却越来越快——这款工具目前已有接近 4.9 亿活跃用户,其中还包括 1 亿海外用户。

如此受欢迎的原因当然是因为最近的大幅升级,如今在 WPS 上你会发现不少 AI 能力的加持。

7 月 22 日,金山办公在珠海举行了首次技术开放日。在活动中这家公司不仅展示了 WPS 上最新应用的技术,还发布了 KSAI-lite,业内第一个面向办公领域的深度学习框架。

微信图片_20211206093515.jpg


对于众多使用者来说,如今的 WPS 已不再仅仅是一个文件编辑工具。「WPS 是一个成熟的办公软件,应该学会自己做 PPT 了,」金山办公副总裁、AI 中台负责人姚冬说道。

用最新版本的 WPS 编辑演示文稿,你只需要用文字列出一个思维导图,或者在每一页空白的 PPT 上打上文字,甚至只需要打开一个 Word 文档,AI 就可以帮助你实现智能配图、表格美化、多图拼图、多图轮播、图片介绍等多种效果,几秒钟生成一份可用的 PPT。

微信图片_20211206093520.gif


如上图所示,「智能美化」功能可以自动为纯文字内容推荐出几十种 PPT 样式,加入背景、调好字号和格式,它们都是使用 AI 算法基于文字内容的语义产生的。如果你已有素材图片,只需要把它们堆放在幻灯片上就可以一键美化图片,自动整理好排版或加入动画特效。

这种自动生成 PPT 的功能既可以进行单页面美化,也可以实现全局换肤、对齐排版、配色、字体统一等问题。在使用时,你只需关注要介绍的内容,无须在选模版、调格式等操作上花费时间,大幅提升了效率,也解决了不常做 PPT 的人「一时找不到如何下手」的重要问题。

值得注意的是,在 AI 推荐的模板中,也有相当一部分是由算法自动生成的,这些都是金山办公后台几十台服务器 AI 模型训练获得的成果。

除了自动生成 PPT 之外,WPS 强大的 OCR「光学文字识别」技术也被人们经常使用。这个工具可以将书籍和文件的图片转成文字,并保留原排版,让原照片上的表格、分栏和图片都转至新文档中,并成为可编辑状态。对于 AI 来说,即使是照歪一点也不是问题。

金山办公还介绍了 WPS 中的「辅助写作」功能:如果你对写文章一时没有思路,只要写一个大概的提纲,AI 就可以自动生成一些段落。没开始写的情况下文章就已经有上千字了,其中都是语料算法生成的段落。

自动生成的文字内容合理吗?金山办公表示,用于模型训练的语料库是与人民网等机构合作完成的,其中包括媒体历年发布的文章,此外还包含大量官方出版物。

轻松办公是金山对 AI 时代办公软件确立的目标。「在效率上,WPS 的智能美化、智能表格等功能可以将用户的很多操作由分钟级提升至秒级;在用户体验方面,我们自研的全文翻译引擎可以解决不同类别文档识别翻译难、排版还原难等问题,快速输出高质量的译文,」姚冬表示。

微信图片_20211206093525.jpg

金山办公副总裁、AI 中台负责人姚冬在活动中。

在开放日上,金山办公还发布了一款人工智能深度学习推理框架 KSAI-lite,这是一款免费、开源、跨多个终端的全新工具,适配国内外主流软硬件平台,在 OCR、机器翻译、智能校对等落地场景上为开发者们带来了新选择。

KSAI-lite 面向通用性、高性能、轻量和专业性四个目标构建。在技术实践中,金山的开发团队在多框架支持、软硬件适配、性能、功耗、内存等方面都进行了优化。

在 KSAI-lite 中首个开源的是 OCR 模型,其支持移动端设备的离线识别,模型和库文件共计不到 9MB。该模型在文本检测、文本分类和文本识别上都表现出了业内第一梯队的性能。

据介绍,KSAI-lite 框架底层基于 TensorFlow,目前已经在 GitHub 上开源:https://github.com/kingsoft-wps/KSAI-Toolkits

微信图片_20211206093529.jpg


金山办公表示,未来 KSAI-lite 还会在更丰富的平台适配能力、更个性的开发方式、更稳定的业务支持能力上持续发力,为金山办公产品线和整个业界提供更多 AI 能力的支持。

金山办公转型 AI 的时间其实已经不短:其自 2017 年成立的 AI 中台如今已拥有超过 100 人的规模。几年内这一团队完成了 OCR、文档翻译、图文识别检测等多领域应用的落地,一些研究也已被 AI 顶会收录。

迄今为止,金山办公 AI 中台围绕办公领域的计算机视觉、自然语言处理相关算法研究已开发了近 100 项 AI 能力,WPS 的智能校对功能月校对字数超过 70 亿,智能生成的内容占据云端整体内容资源的 33.6%,智能美化功能月度活跃用户数量也已超过百万。

在公司内部,AI 中台还打造了基于分布式训练的 AI 训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。

WPS 在办公软件领域已拥有 30 余年的技术积累,由于支持从 Windows 到 Linux 的绝大多数操作系统和硬件,它受到了人们的持续欢迎。随着 AI 等技术的应用,未来我们还能期待 WPS 为我们带来更多、更方便的功能。

「WPS 为文字处理而生,而文字是办公活动的核心。我们在未来会继续以文字处理为核心研发新技术,满足企业数字化转型的巨大需求,」姚冬表示。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
吉特仓储管系统(开源WMS)--分享两月如何做到10W+的项目
  在此文开篇之处先特别申明,此文在有些人的眼中会有广告的嫌疑,但是本人不想将其作为一个广告宣传的文章,在此提到软件内容部分请大家予以谅解和包含,作为时间不算短的程序员给大家分享一些自己开发吉特仓储管理软件相关的经验和坑,当然还有一些自己从中获利的方式,不能说给大家指条明路吧,算是作为程序开发人的相互经验交流。
1857 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,大概有三种登录方式:
2958 0
12月5日云栖精选夜读:沸腾!阿里又开源了一项自研核心技术!
近日,阿里正式开源了基于 Apache 2.0 协议的容器技术 Pouch。Pouch 是一款轻量级的容器技术,拥有快速高效、可移植性高、资源占用少等特性,主要帮助阿里更快的做到内部业务的交付,同时提高超大规模下数据中心的物理资源利用率。
3991 0
腾讯优图开源人脸识别底层技术:一款深度学习推理框架TNN
6月10日,腾讯优图实验室开源了一款深度学习推理框架TNN,高效解锁计算机视觉算法。
14 0
.NET平台开源项目速览(7)关于NoSQL数据库LiteDB的分页查询解决过程
原文:.NET平台开源项目速览(7)关于NoSQL数据库LiteDB的分页查询解决过程   在文章:这些.NET开源项目你知道吗?让.NET开源来得更加猛烈些吧!(第二辑) 与 .NET平台开源项目速览(3)小巧轻量级NoSQL文件数据库LiteDB中,介绍了LiteDB的基本使用情况以及部分技术细节,我还没有在实际系统中大量使用,但文章发布后,有不少网友( loogn)反应在实际项目中使用过,效果还可以吧。
911 0
吉特仓库管理系统-- 后台管理开源啦,源码大放送
  吉特仓储管理系统已经开发好些年了,已经不记得有多少个版本的迭代, 就针对前端UI以及项目结构等重大修改也经历了好几次。吉特仓储管理系统这个名称其实也就今年才开始使用,在此之前都已客户公司命名,基本也是针对客户定制服务。
3373 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
7359 0
微软放出首款开源博客内容管理系统Oxite
“开源”两个字通常和微软扯不上太多的联系,不过,今天微软却出乎意料的放出了首款开放源码的博客/CMS内容管理系统,Oxite。软件使用Microsoft Public License (MS-Pl)授权方式,源代码完全公开。
767 0
开源Math.NET基础数学类库使用(05)C#解析Delimited Formats数据格式
原文:【原创】开源Math.NET基础数学类库使用(05)C#解析Delimited Formats数据格式  开源Math.NET基础数学类库使用系列文章总目录:    1.开源.NET基础数学计算组件Math.
949 0
1946
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载