AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

本文涉及的产品
小语种识别,小语种识别 200次/月
个人证照识别,个人证照识别 200次/月
通用文字识别,通用文字识别 200次/月
简介: 自动生成 PPT,自动图片转文字 + 翻译,甚至自动辅助写文章…… 办公自动化的未来已来。


WPS 是个已有超过 30 年历史的办公软件,但它最近的用户数量增长却越来越快——这款工具目前已有接近 4.9 亿活跃用户,其中还包括 1 亿海外用户。

如此受欢迎的原因当然是因为最近的大幅升级,如今在 WPS 上你会发现不少 AI 能力的加持。

7 月 22 日,金山办公在珠海举行了首次技术开放日。在活动中这家公司不仅展示了 WPS 上最新应用的技术,还发布了 KSAI-lite,业内第一个面向办公领域的深度学习框架。

微信图片_20211206093515.jpg


对于众多使用者来说,如今的 WPS 已不再仅仅是一个文件编辑工具。「WPS 是一个成熟的办公软件,应该学会自己做 PPT 了,」金山办公副总裁、AI 中台负责人姚冬说道。

用最新版本的 WPS 编辑演示文稿,你只需要用文字列出一个思维导图,或者在每一页空白的 PPT 上打上文字,甚至只需要打开一个 Word 文档,AI 就可以帮助你实现智能配图、表格美化、多图拼图、多图轮播、图片介绍等多种效果,几秒钟生成一份可用的 PPT。

微信图片_20211206093520.gif


如上图所示,「智能美化」功能可以自动为纯文字内容推荐出几十种 PPT 样式,加入背景、调好字号和格式,它们都是使用 AI 算法基于文字内容的语义产生的。如果你已有素材图片,只需要把它们堆放在幻灯片上就可以一键美化图片,自动整理好排版或加入动画特效。

这种自动生成 PPT 的功能既可以进行单页面美化,也可以实现全局换肤、对齐排版、配色、字体统一等问题。在使用时,你只需关注要介绍的内容,无须在选模版、调格式等操作上花费时间,大幅提升了效率,也解决了不常做 PPT 的人「一时找不到如何下手」的重要问题。

值得注意的是,在 AI 推荐的模板中,也有相当一部分是由算法自动生成的,这些都是金山办公后台几十台服务器 AI 模型训练获得的成果。

除了自动生成 PPT 之外,WPS 强大的 OCR「光学文字识别」技术也被人们经常使用。这个工具可以将书籍和文件的图片转成文字,并保留原排版,让原照片上的表格、分栏和图片都转至新文档中,并成为可编辑状态。对于 AI 来说,即使是照歪一点也不是问题。

金山办公还介绍了 WPS 中的「辅助写作」功能:如果你对写文章一时没有思路,只要写一个大概的提纲,AI 就可以自动生成一些段落。没开始写的情况下文章就已经有上千字了,其中都是语料算法生成的段落。

自动生成的文字内容合理吗?金山办公表示,用于模型训练的语料库是与人民网等机构合作完成的,其中包括媒体历年发布的文章,此外还包含大量官方出版物。

轻松办公是金山对 AI 时代办公软件确立的目标。「在效率上,WPS 的智能美化、智能表格等功能可以将用户的很多操作由分钟级提升至秒级;在用户体验方面,我们自研的全文翻译引擎可以解决不同类别文档识别翻译难、排版还原难等问题,快速输出高质量的译文,」姚冬表示。

微信图片_20211206093525.jpg

金山办公副总裁、AI 中台负责人姚冬在活动中。

在开放日上,金山办公还发布了一款人工智能深度学习推理框架 KSAI-lite,这是一款免费、开源、跨多个终端的全新工具,适配国内外主流软硬件平台,在 OCR、机器翻译、智能校对等落地场景上为开发者们带来了新选择。

KSAI-lite 面向通用性、高性能、轻量和专业性四个目标构建。在技术实践中,金山的开发团队在多框架支持、软硬件适配、性能、功耗、内存等方面都进行了优化。

在 KSAI-lite 中首个开源的是 OCR 模型,其支持移动端设备的离线识别,模型和库文件共计不到 9MB。该模型在文本检测、文本分类和文本识别上都表现出了业内第一梯队的性能。

据介绍,KSAI-lite 框架底层基于 TensorFlow,目前已经在 GitHub 上开源:https://github.com/kingsoft-wps/KSAI-Toolkits

微信图片_20211206093529.jpg


金山办公表示,未来 KSAI-lite 还会在更丰富的平台适配能力、更个性的开发方式、更稳定的业务支持能力上持续发力,为金山办公产品线和整个业界提供更多 AI 能力的支持。

金山办公转型 AI 的时间其实已经不短:其自 2017 年成立的 AI 中台如今已拥有超过 100 人的规模。几年内这一团队完成了 OCR、文档翻译、图文识别检测等多领域应用的落地,一些研究也已被 AI 顶会收录。

迄今为止,金山办公 AI 中台围绕办公领域的计算机视觉、自然语言处理相关算法研究已开发了近 100 项 AI 能力,WPS 的智能校对功能月校对字数超过 70 亿,智能生成的内容占据云端整体内容资源的 33.6%,智能美化功能月度活跃用户数量也已超过百万。

在公司内部,AI 中台还打造了基于分布式训练的 AI 训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。

WPS 在办公软件领域已拥有 30 余年的技术积累,由于支持从 Windows 到 Linux 的绝大多数操作系统和硬件,它受到了人们的持续欢迎。随着 AI 等技术的应用,未来我们还能期待 WPS 为我们带来更多、更方便的功能。

「WPS 为文字处理而生,而文字是办公活动的核心。我们在未来会继续以文字处理为核心研发新技术,满足企业数字化转型的巨大需求,」姚冬表示。

相关文章
|
7天前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
114 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
|
3天前
|
人工智能 自然语言处理 数据可视化
Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表
Data Formulator 是微软研究院推出的开源 AI 数据可视化工具,结合图形化界面和自然语言输入,帮助用户快速创建复杂的可视化图表。
142 9
Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表
|
7天前
|
人工智能 开发框架 机器人
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
2049 13
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
|
9天前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
776 14
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
|
5天前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
342 7
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
6天前
|
人工智能 开发框架 数据可视化
Eino:字节跳动开源基于Golang的AI应用开发框架,组件化设计助力构建AI应用
Eino 是字节跳动开源的大模型应用开发框架,帮助开发者高效构建基于大模型的 AI 应用。支持组件化设计、流式处理和可视化开发工具。
122 27
|
2天前
|
人工智能 自然语言处理 架构师
Praison AI:LangChain危险了!这个低代码框架让AI智能体「自主协作」,1行代码搞定任务编排
Praison AI 是一个开源的多智能体框架,支持低代码创建和管理AI代理,提供多种流程类型和集成选项,适用于企业流程自动化、智能客服等场景。
58 18
|
5天前
|
存储 人工智能 NoSQL
Airweave:快速集成应用数据打造AI知识库的开源平台,支持多源整合和自动同步数据
Airweave 是一个开源工具,能够将应用程序的数据同步到图数据库和向量数据库中,实现智能代理检索。它支持无代码集成、多租户支持和自动同步等功能。
53 14
|
3天前
|
人工智能 JSON 搜索推荐
猫步简历 - 开源免费AI简历生成器 | 一键导出PDF/JSON
猫步简历是一款免费开源的AI简历生成器,帮助用户轻松创建独特、专业的简历。支持导出超高清PDF、图片、JSON等多种格式,并提供AI智能创作、润色和多语种切换等功能。拥有海量模板、高度定制化模块及完善的后台管理系统,助力求职者脱颖而出。官网:https://maobucv.com,GitHub开源地址:https://github.com/Hacker233/resume-design。
66 10
|
5天前
|
存储 人工智能 API
ChatGPT-on-WeChat:Star32.4k, DeepSeek加持!这款开源神器秒变AI助手,聊天体验直接起飞!
嗨,大家好,我是小华同学。今天为大家介绍一款结合DeepSeek引擎的开源项目——ChatGPT-on-WeChat,由开发者zhayujie打造。它将微信变成智能AI助手,支持文本、图片、语音对话,具备定时提醒、天气查询等扩展功能,完全开源且易于定制。项目地址:https://github.com/zhayujie/chatgpt-on-wechat。关注我们,获取更多优质开源项目和高效学习方法。
106 11