科技云报道:不卷自研大模型,金山办公如何创新生成式AI?

简介: 避免重复开发大模型

科技云报道原创。

过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。

“重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落地也就变得遥遥无期。

今年年初金山办公宣布All in AI,将LLM能力全面引入产品,发布基于大语言模型的智能办公助手WPS AI。

相较于大模型玩家普遍把“重做一遍”视为创新路径时,WPS AI带来了另一种大模型创新方法论——与其“重做一遍”,不如去“重新发现”。

未命名1699236874.png

据悉,金山办公选择在大模型应用侧下功夫,WPS国内版与WPS海外版同时推进WPS AI研发落地,让每个模型都能充分发挥自身的优势。

正因如此,WPS AI甚至比微软的Microsoft 365 Copilot还快了一步,成了国内第一个将大语言模型(LLM)应用在办公软件领域,并真正交付了可用产品的公司。

自今年4月18日首次亮相以来,WPS AI在短短50天里对多个核心办公场景进行了赋能,用“金山速度”不断刷新着生成式AI的应用边界。

如此惊人的进化速度,WPS AI是如何实现的?

生成式AI的背后是大模型服务的支撑

如果你是WPS的用户,最近可能会观察到一些变化:金山文档「智能文档」的新功能已经能够帮你提供新闻稿、广告文案、教学教案、工作周报等种种文件的起草、改写、总结、润色、翻译、续写等功能。

除此之外,它还可以帮你一键生成幻灯片、一键分析Excel数据、翻译总结文档,自己写日报等等。

通过AI大模型,WPS构建出一个更高效、快捷释放场景能力的智能交互系统,去解决用户多元且碎片化的办公需求。

不可否认,生成式AI本身的能力非常惊艳,但是生成式AI远远不只是以模型和AI这么简单。

基础模型只是在海面上的冰山一角,为了支持好这个冰山一角,冰川的底部有多个服务来支撑,比如说加速芯片、存储优化、数据库、大数据分析、安全服务等等。

不仅如此,支撑生成式AI的每一种技术和基础设施环境,都在发生着快速变化。

以基础模型为例,其发展是按照月甚至按照天的速度来迭的。2019年,最大的预训练模型是3.3亿个参数,但到了2023年,大模型最大的参数已经超过了五千亿个,也就是说短短四年,整个参数的迭代超过了1600倍。

同时,国内外都掀起了“百模大战”,从最开始出现的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,还包括国内正在自研的基础模型如百川、ChatGLM等,每个模型都具备着他们自己独有的场景和优势。

正如亚马逊云科技的CEO Adam Selipsky所说,没有一个基础模型可以适用于所有的业务场景,用户会根据自己的场景去选择最适合自己的基础模型。

这一点放在金山办公身上同样适用。

金山办公AI研发总监刘强在采访中表示,几乎很少有一个模型能涵盖全部的能力,通常一个功能需要多个模型协作,需要考虑不同模型之间的调用方式不一样。

但Amazon Bedrock的模型管理,能把不同大模型底层的API做成透明统一的,这减轻了很大的工作量。

图片1.png

金山办公AI研发总监 刘强

刘强提到的Amazon Bedrock,是亚马逊云科技今年4月发布的一项生成式AI重要产品。

它支持来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等领先人工智能公司的高性能基础模型,并可以轻松安全地进行自定义模型训练。

作为国内第一批Amazon Bedrock的预览版用户,金山办公可以在轻松使用这些高性能基础模型的同时,也能够使用自己的数据构建差异化的应用程序。

与此同时,金山办公通过使用机器学习平台Amazon SageMaker,正在帮助算法科学家快速进行场景实验和算法迭代。

Amazon SageMaker不仅可以避免算法科学家从头搭建模型,还可以通过Amazon SageMaker JumpStart功能帮助客户快速构建和部署模型,从而尝试多种开源模型。

可以说,有了这类大模型管理作为基础服务作为支撑,生成式AI的应用创新事倍功半。

生成式AI要效率也要安全合规

随着大模型的发展,数据的合规性和安全性成为亟待解决的问题。

在生成式AI领域中,数据的获取、加工及利用的方式决定了模型的性能和准确性。数据的非法泄漏、被恶意篡改,可能导致训练出的模型有误导性;非法获取或使用未经授权的数据,不仅违法,还可能使得模型偏离了其原本的目的。

前段时间,OpenAI被指控训练ChatGPT时使用从互联网上抓取的数据,大规模侵犯了无数人的版权和隐私。目前全球各国对于企业使用大模型的数据安全要求已日益提升。

不少企业在构建大模型时也普遍要求私有化部署,即在加密环境中使用私有数据训练模型,以控制相关数据和模型的安全风险。

金山办公AI研发总监刘强表示,WPS非常重视数据安全,有专业的团队及合作伙伴共同打造完善的数据安全体系,在各个国家和地区可以有效的保障用户隐私。

正因对安全合规的重视,金山办公作为一家中国企业得以顺利走向全球。截至2022年底,WPS在海外已拥有超过1亿活跃用户,WPS Office累计获得近4亿次安装。

从与金山办公合作的亚马逊云科技大模型服务来看,Amazon Bedrock在安全合规方面也助力颇多。

据亚马逊云科技解决方案架构师介绍,在开发之初就考虑到安全性和隐私保护,帮助客户保护敏感数据:

首先,Amazon Bedrock从服务设计层面就确保了客户的数据以及客户相关的信息不会被用于进一步训练模型。所有的客户数据都是经过加密的,且只有客户能够访问。

其次,客户可以使用Amazon PrivateLink,在Amazon Bedrock与虚拟私有网络(VPC)之间建立专门的安全连接,确保任何数据传输都不会暴露在公共网络。

最后,对于存在高度监管需求的客户,Amazon Bedrock符合 HIPAA(《健康保险流通与责任法案》)要求,并且可以在 GDPR(欧盟《通用数据保护条例》)合规标准下使用,让更多的客户从生成式AI中获益。

不难发现,金山办公也可以利用它有效提升安全合规工作的效率,并确保客户数据的安全性,让金山办公的实力得以在海外充分释放。

构建生成式AI需要高性价比的基础设施

正如前文所说,开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,需要各种技术和工具来解决挑战,而高性价比的基础设施正是其强有力的支撑。

早在生成式AI创新之前,金山办公就在积极探寻如何利用AI/ML技术为业务赋能。在数据存储、现代化应用开发、AI/ML、芯片等层面,金山办公与亚马逊云科技都有深度合作。

例如,WPS Office通过使用Amazon S3高效低成本地实现了PB级海量数据存储。

通过Amazon S3的智能分层功能,在存储方面获得了40%以上的成本优化效果;利用亚马逊云科技在美国、日本和印度的节点,将终端用户的响应延迟从日常大于1秒减少稳定至500毫秒以下。

在构建精细化运营方面,金山办公基于机器学习平台Amazon SageMaker服务构建了从用户识别、用户转换到流失用户挽回的一整套用户精细化运营路径,通过人工智能预测用户购买,增强用户转化率。

除此之外,金山办公还在尝试利用亚马逊提供的GPU机型和为生成式AI而打造的专门构建的加速芯片(Amazon Inferentia和Amazon Trainium),为海外业务部署开源模型方案,并且尝试利用加速芯片来降低成本。

总的来说,避免重复开发大模型,专注于模型的开发效率、调优以及对底层基础设施的高效利用,金山办公为AI应用带来了新的研发方式,也为AI应用开发者值得借鉴的思路。

未来,金山办公还将以AIGC(内容创作)、Copilot(智慧助理)和Insight(知识洞察)三个战略方向为核心,掀起办公交互方式的新一轮变革。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
10天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
46 3
|
19天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
87 2
|
12天前
|
人工智能 弹性计算 Serverless
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
本文介绍了零售业中“人—货—场”三要素的变化,指出传统营销方式已难以吸引消费者。现代消费者更注重个性化体验,因此需要提供超出预期的内容。文章还介绍了阿里云基于函数计算的AI大模型,特别是Stable Diffusion WebUI,帮助非专业人士轻松制作高质量的促销海报。通过详细的部署步骤和实践经验,展示了该方案在实际生产环境中的应用价值。
45 6
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
|
9天前
|
人工智能 新制造 芯片
2024年中国AI大模型产业发展报告解读
2024年,中国AI大模型产业迎来蓬勃发展,成为科技和经济增长的新引擎。本文解读《2024年中国AI大模型产业发展报告》,探讨产业发展背景、现状、挑战与未来趋势。技术进步显著,应用广泛,但算力瓶颈、资源消耗和训练数据不足仍是主要挑战。未来,云侧与端侧模型分化、通用与专用模型并存、大模型开源和芯片技术升级将是主要发展方向。
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
【10月更文挑战第31天】2024年,AI大模型在软件开发领域的应用取得了显著进展,从自动化代码生成、智能代码审查到智能化测试,极大地提升了开发效率和代码质量。然而,技术挑战、伦理与安全问题以及模型可解释性仍是亟待解决的关键问题。开发者需不断学习和适应,以充分利用AI的优势。
|
17天前
|
人工智能 JSON 自然语言处理
基于文档智能&RAG搭建更懂业务的AI大模型
本文介绍了一种结合文档智能和检索增强生成(RAG)技术,构建强大LLM知识库的方法。通过清洗文档内容、向量化处理和特定Prompt,提供足够的上下文信息,实现对企业级文档的智能问答。文档智能(Document Mind)能够高效解析多种文档格式,确保语义的连贯性和准确性。整个部署过程简单快捷,适合处理复杂的企业文档,提升信息提取和利用效率。
|
13天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
70 4
|
4天前
|
人工智能 弹性计算 数据可视化
解决方案|触手可及,函数计算玩转 AI 大模型 评测
解决方案|触手可及,函数计算玩转 AI 大模型 评测
14 0
|
18天前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。

热门文章

最新文章

下一篇
无影云桌面