新浪微博AIGC业务应用探索-AIGC应用平台助力业务提效实践

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 本次分享围绕AIGC技术在新浪微博的应用展开,涵盖四个部分。首先分析AIGC为微博带来的机遇与挑战,特别是在内容安全和模型幻觉等问题上的应对策略;其次介绍通过工程架构快速实现AIGC技术落地的方法,包括统一部署模型和服务编排;接着展示AIGC在微博的具体应用场景,如评论互动、视频总结和智能客服等;最后展望未来,探讨大模型的发展趋势及其在多模态和特定业务场景中的应用前景。

本次分享的主题是 AIGC在新浪微博落地的探索。本次分享将围绕四个部分展开。首先,简单分析AIGC技术在新浪微博场景应用中带来的机遇与挑战;然后,介绍如何通过工程架构的方式帮助技术快速落地应用到实际业务中;接下来介绍在微博的实际业务中有哪些场景应用了AIGC的技术;最后,简要阐述展望。

 

一、AIGC技术在微博应用中带来的机遇与挑战

在介绍AIGC技术在场景应用中带来的挑战前,首先需要了解场景。

微博作为一个社交媒体平台,在较为集中的领域,例如娱乐明星和社会热点,人们会在这些领域中讨论一些公共热点事务,目前,活跃人数较多。在这种场景下,微博在AIGC的应用技术上,做过很多想法与尝试。


接下来介绍AIGC技术,由于AIGC技术于2022年下半年产生GDP后,该技术风靡整个技术圈。此外,由于该技术可能产生了一种智能涌现的方式,使得人们认为AI可应用于各个场景,并理解人的意图。在该过程中,可以发现该技术的优点和缺点。


在观察这张图时,相信大部分实际使用AIGC技术的使用者有较为深刻的体会。AIGC技术,特别是基地产生之后,使用者可以发现它带来的惊喜。一是大模型具有非常好的、与人一样的理解能力,它可以在交流过程中,给予使用者较为相应的回复。二是具有创造力,在创造力方面,它可以给予使用者意料之外的有意思的回复。但当使用者将其实际应用到业务中后,使用者会发现似乎存在很多问题。


例如,安全性问题,在使用过程中,AI对于一些问题的回复,看起来是无误的,但当真正应用到业务场景中时,可能会出现一些安全合规的问题,特别是微博这类的媒体行业,在内容安全方面是非常重要的。由于大模型随着训练语料的不同,其生成的内容可能带有偏好,那么在媒体该类行业,此问题具有致命性。


此外,大模型会让使用者产生幻觉,在使用过程中,其回复结果有时相应,有时无中生有。因此基于对该情况的考虑,使用者在应用过程中需要发挥其长处,抑制缺点。所以,当真正去使用AIGC技术在业务应用的过程中,使用者一定要考虑几件事情:


第一是使用者要快速去尝试AIGC技术能否在业务场景应用,在其中具有快速施策的过程。希望在业务使用过程中,能够更方便将大模型的能力快速应用到业务中,同时并不需要其了解太多的细节。并且发现通义2.5也快速发布,所以我们会发现大模型能力迭代非常快,一种模型发布后,能否快速应用到业务中,这是非常关键的。


第二,在真正实际应用业务中,其实并非是简单的将问题抛给大模型就可以直接返回结果,而是需要非常复杂的编排,包括结合业务的功能、结合结合不同的大模型,具有不同的特点,如何将它打包在一起才能真的去解决问题。因此,我们希望在业务使用的过程中,能够拥有非常灵活的编排能力。


最后是内容质量参差不齐,在实际使用过程中,大模型训练语料具有实践性,特别是微博这种场景,需要最新的内容和知识才能在业务场景中真正得到实际应用。以上是需要专业知识和实施知识。同时如何利用IG这种方式去补充大模型。但这些能力或者事情其实并不能希望团队或者公司中每个部门都能去做,由于这些事情的专业性,因此希望需要一个统一的平台去完成。业务部门主要关注业务本身的问题,同时利用统一平台真正的解决问题。


基于以上这个挑战,包括这些真正业务使用过程中可能遇到的问题,所以我们在内部建立了AIGC应用平台,主要是能够帮助业务在将来更方便更灵活的体验使用AIGC技术,然后帮助其能够快速落地到这个业务,这就是平台的最终目标,对于目标,最简单的就是助力AIGC能够在业务中快速的落地。

 

二、如何通过工程架构快速助力技术落地业务中

对于AIGC 技术如何能够在业务快速的落地,进行阐述。该总体架构即AIGC平台应用整体架构。

从上往下说,目前业界的模型更新迭代速度很快,具有开源、闭源等多种版本,例如之前所提及的通义,是我们所应用的主力模型。如果每一种模型都需要右方去处理,是不具有可行性的。因此,我们建设了一个大本营的接入服务底座。


首先是将一些开源的模型统一部署在技术底座的模型以供应所有的部门使用,另外接一些商业模型,将其做成统一服务,业务方在使用时,在界面简单的点选所需的模型即可。业务方无需了解模型如何部署以及已经被屏蔽的比较复杂的被调优的参数等,业务方在真正使用时直接写提示词以及挂其IG即可。


其次,往上看,在拥有大模型后,存在的非常重要的问题即在应用时一定要结合大模型与业务。将微博本身的一些业务做成一些功能插件,然后让其与大模型能够一起做成编排。因此存在一个插件服务,即能够使微博的一些较为重要的功能以插件的方式集成到平台,以方便业务方能够将其业务功能与大模型能力相结合做成一个编排。


此外,在右边知识库,当真正应用到业务时,是需要一些垂直领域的知识,例如大V,当服务大V 时,可能需要去了解和学习大V的一些历史的微博内容,那么此时就需要专有的知识库,拥有了这些内容、大模型能力、微博自身的插件功能以及对应的专业领域知识库后,我们就可以根据业务的实际情况做相关的编排,最终形成一个智能体。


当拥有智能体后,一方面,例如内部提效,内部具有智能体市场供各个业务方以及各个部门相互的共享进行使用。那么在微博上最好的一种接入方式实际上就是微博的账号,因此,会将微博智能体与微博账号相绑定,以账号的形式来展现微博智能体能够提供的相关服务,当使用者艾特账号时能够与它进行智能交互。综上,这是整个应用平台的整体架构,用架构的方式可让业务方屏蔽AIGC技术的一些细节,使得业务方更加专注于业务的使用,提升真正在业务中使用的效率,这,即是之前所提到的大模型底座。


在大模型底座的方面,首先,自身会有GPU等资源的大模型部署,所以会采购GPU相关资源,同时也运用云上的一些资源,例如阿里云,我们也会有一些合作,采购相关资源,因此在基础算力方面,也会采用混合云的方式。众所周知,微博可能是最早采用混合云的企业之一,由于微博热点非常多,所以在CPU年代,其发展已经很成熟,因此在目前GPU使用中,我们能够快速适应。在接触模型后,一方面会接触通义等开源模型,我们根据自己的方式进行部署和微调,同时,接一些商业服务,因为商业服务的效果可能会因为自身更大的算力变得更好,当拥有大模型底座后,观察业务实际是如何应用的。

 

三、新浪微博的哪些场景应用了AIGC技术

以微博为例,其最好的业务场景是评论互动,同时包括作为较好的业务场景——商业热点以及第三方的一些大模型。他们希望把能力展现给用户,微博是一种场景,如何展现?将第三方的大模型能力以账户的方式放到微博上。如果这些场景想应用到大模型,在实际应用过程中需要具有三个要素。


第一是拿到事件源。事件出现后,我们需要知道如何触发智能体的启动。在其中会有一个数据订阅的服务。无论内外部部门,某一部门需要做某一场景的应用,都需要订阅微博消息,第三方同上,在绑定关系后,会把这些账号的消息进行推送,因此这其中会存在一个数据订阅服务,数据订阅服务不仅是将数据订阅进行推送,而且还具有安全把控的作用。


第二是垂直知识库。具有知识库检索增强的服务。


第三是业务功能插件。例如视频处理,将这些相关能力能够接入进来。例如微博前一个非常受欢迎的方式,即视频总结。用户在观看视频时,由于视频时长过长,为节约时间,用户希望快速了解视频的大致内容,所以微博对长视频推出了视频总结的功能,该功能也包含在大模型中。


在该场景中,当某一个大V或用户发送一个视频之后,其会接受到数据源的订阅消息,触发智能体接受这个消息,在知道接受消息后,调用微博的功能,在转码场景下,将视频的内容进行ASR的这种内容的生成,即将视频内容的语音转换成文字,然后抽帧,通过抽帧的方式把视频的内容再做一些多模态的理解。在把内容抽帧出来之后,做一些整体总结,由此就形成了微博的智能体。在上述的操作中,除了用大模型的能力外,还会运用微博本身的内容安全策略做一些过滤和把关,最终把视频输出到业务端。


无论是在娱乐项目、视频项目、搜索项目,实际应用的模式大概一致,以便于业务处理,快速的能够使用大模型的能力。


在服务上线后,受到了公司内部的欢迎。这是我们整理出来的一些实际应用,特别是周报生成器、客服、小助理等,在内部提效里受到了欢迎。


之前一是提到了挑战,第二是如何帮助业务快速的去应用到业务。通过一个工程架构的方式屏蔽一些技术难题,方便业务去落地,接下来观察实际在业务中都落实到哪些业务场景。


从三个方向,一是商业方向,例如to B;二是用户方向,例如to C;三是员工提效方向,例如to E。

在商业方向,比如广告在超粉平台,实际是广告客户在微博投放信息流的自助平台,之前是客户需要做一些文案内容的编写等。此处可以将大模型应用进来,助力其生成一些更好的文案、图片、宣传图片等内容。例如在增值活动中,原先做一些卡牌上的服务,需要设计师生成设计这些图片,存在效率低的情况。如果使用AIGC去生成这些图片,则会较大幅度提高效率。


评论罗伯特是微博应用中的一个非常典型的场景。对于微博而言,跟用户最好的交互方式就是账号。无论大模型、某种能力,一般都是跟账号进行绑定,跟用户有更好的交互。


公司内部通过创新大赛的方式,创建了一个AIGC的一个账号,称为评论罗伯特,它以官方评论机器人的方式,以趣味的方式与用户进行互动,在用户的微博下做相关的具有趣味的评论,该行为受到了微博用户的喜爱。它因诙谐的回复和互动多次登上热搜。在观察其粉丝数量的增长,大概四五个月的时间内,在微博就上涨到将近100万的粉丝,并且都有可能做商业化。因此,在尝试完该模式后,我们与很多大模型厂商进行沟通,开通了一个第三方开放平台,让很多大模型都接进来,通过这种方式展现大模型的能力。


在用户方向,例如to C产品,push文案的生成,众所周知,获取用户,特别在出现热点事件后,我们就要把这些内容推送给用户,此时用户的文案很重要。由于真正push到手机之后,如何在有限的空间中,利用有限的文字将热点的内容清晰地表达清楚,是非常考验编辑能力的。以前在文案生成中,为了达到更好的效果,一般采用人工,但是有了AI后,会发现AI 的效率更高,一方面是高质量,另一方面是速度更快。因此对整个push CTR的反馈和提纲是非常快速的。


所提及的音视频总结也是一个非常好的场景,对于一些优质的长视频,在微博内会有一个视频总结,把整个长视频的每一个段落首先做抽帧成sr信息后,把它做成分段,分段后把精彩内容做相关总结,以方便用户观看,同时将精彩内容推荐给用户。比如用户的一个30分钟的视频,我们将精彩内容提取后,可能通过观看一部分精彩内容以提升用户的阅读效率。


另外是AI智能小助理,微博使用者知晓度较高,用户在微博上发布微博,但实际上能够产生较大互动的,是那些KORL,它拥有几千万的粉丝,如果他想和所有粉丝进行互动和回复是不可行的,因此他可以用微博的账号内容生成数字分身,即AI 小助理,他可以使用AI小助理回复他本身回复不过来的内容,由此加深他跟粉丝之间的互动效率。


这是第三方大模型的接入,在评论罗伯特的尝试成功之后,在业界有很多大模型厂商,存在如何将自身能力展现给普通用户的诉求。我们产生AIGC 平台,第三方大模型可以申请进行接入,在微博开通账号,与其大模型进行绑定。在微博业务场景中,若用户艾特到了大模型绑定的账号,我们会把对应的消息传送给第三方大模型,大模型根据自身的能力,对这些与他互动的这些粉丝进行回复,若回复效果较好,那么会得到粉丝的青睐。目前有很多大模型厂商,包括通义也在微博做相关的接入。这里会在博文发布响应用户的提及,包括与粉丝互动方面一直做非常好的互动。


微博诚邀第三方的大模型能够接入微博的第三方开放平台,以账号的方式降低大模型与用户之间的生疏度,对于大模型而言,是传播与展现大模型能力的一种方式。


三是内部提效方面,例如to E。有两个较好的场景。一是微博客服,众所周知,客服存在于各行各业。这里是在AI领域里非常成熟的一个方向。通过大模型的能力,能够对微博用户回复的质量进行很好的检查,因此较好的节省人力客服,提升客服回复的效率。二是微博编程助手,称为Wei code。那么其实阿里也有通义灵码。但是作为一个稍微有规模的公司,对整个AI在研发效率这方面都要有一个较好的真正的理解。真正理解是要在这个领域进行探索。


所以利用开源模型,包括阿里的通义大模型,结合微博内部的一些实际情况,研发自己的微博编程助手。在其中,有问答区、代码生成区、内部主件区,通过这种方式来提升研发人的效率。那么结合之前的AIGC应用平台,也有一个称为微博智能笔插件,让每个程序员都能在微博贡献编程效率的工具,因此共建和打造微博的整体的研发环境。


编程助手,在微博有80%以上的工程师使用,平均代码采纳率达到31%,主流代码采纳率可能达到35%。这其中,会发现底层应用不同的大语言模型,它对于不同语言不同场景的采纳率是不同的,有些大模型用Python效果特别好,有些大模型用 Java效果特别好,模型对一些工程架构的代码生成效果好,有些模型对业务代码生成效果好。所以经过AP test的测试,在上面做了一层的调度。


那么会根据ab实验的情况,根据之前的一些生成效果,然后把不同用户的请求调度到不同的有优势的大模型来生成,以提升整体的采纳率。若是使用一种模型去生成,则很难提升整体采纳率。若将后面的多个模型接受适合场景的请求,则效果会非常好。最终做了调研问卷,满意度非常高。

 

四、AIGC业务应用的展望

对于前景的展望,未来整个大模型发展以及迭代非常快。对于大模型而言:


一是阿里既开源也闭源,则这种方式将是继续并存。对于真正做例如千亿参数的大模型,由于算力成本非常高,因此只有几个大厂真正参与竞争。对于开源这些中型模型,很多厂可以利用开源这种优势去发展,同时我们会在开源方向做一些贡献。另外是自身大的大模型将会越来越大,例如通义逐渐做更大的模型,拉玛做四千亿参数的大模型。小的模型也会在手机上运行。因此,未来趋势是参数大的越来越大,参数小的在手机上可继续应用。所以,一般是大象端与小象端,这是一个非常强烈的趋势。


二是在相当长一段时间内,大模型的能力和业务场景是有概括,它通用代表着对某一专用的场景,但不一定专。如何去捕捉,通用场景是AIGC的方式,把一些专业知识放进其中,除了用向量化的方式、标准ING的方式,目前Grap ING也是一种受到欢迎的方式。


三是多模态,目前在通义的大模型专场中也提到了通义万相,这也是经常会使用的大模型的业务能力。在微博场景中也是一样,目前除了文字上的消费越来越多,我们对图像和视频消费愈多,所以在应用上会有强烈的发展。


在真正在实际应用的过程中,会发现目前有很多场景,大模型在改变各行各业,但在实际使用过程中,大家会发现,很多时候大模型并没有达到理想中的情况,很多东西更多是好玩,和真正的好用仍然存在很大的一段距离。


目前在行业中探讨,真正比较好用的方向是只有两个,一是Gsou方向,二是代码编程方向,这是较为公认的大模型会产生好效果的方向。


但是在其他方向,如果想达到更好的效果,其实是还需要大模型能力的提升,另一方面,仍然有大模型能力跟业务实际效果要有很多衔接的工作,所以真正的做到把大模型应用到业务,真正改变实际业务,其实还有很长一段路要走,一方面是大模型能力不断地提升,像阿里、通义等大厂的大模型能力进一步提升后,真正应用的业务方也需要把业务场景和大模型能力做一些中间的结合,使它更好的应用到业务中。

 

 

 

相关文章
|
2月前
|
弹性计算 算法 搜索推荐
活动实践 | 通过函数计算部署ComfyUI以实现一个AIGC图像生成系统
ComfyUI是基于节点工作流稳定扩散算法的新一代WebUI,支持高质量图像生成。用户可通过阿里云函数计算快速部署ComfyUI应用模板,实现个性化定制与高效服务。首次生成图像因冷启动需稍长时间,之后将显著加速。此外,ComfyUI允许自定义模型和插件,满足多样化创作需求。
|
3月前
|
人工智能 编解码 自然语言处理
|
3月前
|
机器学习/深度学习 人工智能 缓存
基于AIGC的自动化内容生成与应用
基于AIGC的自动化内容生成与应用
134 3
|
3月前
|
机器学习/深度学习 自然语言处理 Go
Python与Go在AIGC领域的应用:比较与分析
Python与Go在AIGC领域的应用:比较与分析
76 0
|
5月前
|
机器学习/深度学习 数据采集 人工智能
作为AIGC技术的一种应用-bard
8月更文挑战第22天
75 15
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|
5月前
|
机器学习/深度学习 自然语言处理 监控
|
5月前
|
机器学习/深度学习 设计模式 人工智能
面向对象方法在AIGC和大数据集成项目中的应用
【8月更文第12天】随着人工智能生成内容(AIGC)和大数据技术的快速发展,企业面临着前所未有的挑战和机遇。AIGC技术能够自动产生高质量的内容,而大数据技术则能提供海量数据的支持,两者的结合为企业提供了强大的竞争优势。然而,要充分利用这些技术,就需要构建一个既能处理大规模数据又能高效集成机器学习模型的集成框架。面向对象编程(OOP)以其封装性、继承性和多态性等特点,在构建这样的复杂系统中扮演着至关重要的角色。
78 3
|
5月前
|
设计模式 数据采集 人工智能
面向对象设计在AIGC项目中的应用
【8月更文第12天】面向对象编程(Object-Oriented Programming, OOP)是一种软件开发方法,它通过将数据和行为封装到一起形成对象来组织代码。OOP提供了几个核心概念,包括封装、继承和多态性,这些概念有助于构建灵活、可维护和可扩展的软件系统。在人工智能生成内容(Artificial Intelligence Generated Content, AIGC)项目中,OOP的设计原则尤其重要,因为这类项目往往涉及复杂的算法和大量的数据处理。
54 0
|
6月前
|
存储 自然语言处理 API
通义万相AIGC技术Web服务体验评测
随着人工智能技术的不断进步,图像生成技术已成为创意产业的一大助力。通义万相AIGC技术,作为阿里云推出的一项先进技术,旨在通过文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,加速艺术家和设计师的创作流程。本文将详细评测这一技术的实际应用体验。
206 4