每日互动(个推)CTO叶新江:AIGC时代,大模型推动数据要素商业化

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
数据安全中心,免费版
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 在近期举行的2023数据安全发展大会·数据智能安全与发展论坛上,每日互动(个推)CTO叶新江先生围绕AIGC时代下大模型给大数据企业带来的机遇与挑战进行了深入分享。

ChatGPT在一夜之间火爆互联网,让AIGC受到世界范围内的高度关注。时至今日,AIGC热度持续高涨,各大互联网公司争相布局这一领域。日渐成熟的技术、显著的降本增效优势以及日益增长的市场需求等因素,已经推动AIGC成为互联网公司新一轮必争之地。
在近期举行的2023数据安全发展大会·数据智能安全与发展论坛上,每日互动(个推)CTO叶新江先生围绕AIGC时代下大模型给大数据企业带来的机遇与挑战进行了深入分享。
52af7b4adb7c63ec928f0b8783f786a.jpg
图:每日互动(个推)CTO叶新江在数据智能安全与发展论坛上分享AIGC话题

大模型将推动数据要素商业化

上世纪90年代开始,随着大规模集成电路、芯片技术的突破,个人电脑进入了千家万户。个人电脑能为大家所广泛使用,还有一个核心原因就是,操作系统的出现大大降低了人们操作电脑的难度。也有人将LLM基础下AIGC技术的突破看作是智能操作系统的迭代,认为其标志着多模态智能时代的来临。
犹如之前计算机、互联网的普及给整个人类社会带来巨大的生产和效率的提升,AIGC技术也将会改变人们工作、生活的范式,具有里程碑式的作用。它将整体提升人类的知识水平,而如何更好地使用各种“副驾驶”,将成为未来的竞争重心。实际上,在这样一个时代下,拓宽每个人的认知边界,“学问”(即“学习如何更好地问”)将成为更重要的能力。
对此,叶新江认为在VUCA时代,要突破生产效率,必须有新的能源或能量。而在数据要素市场,这个“能源+能量”就是“数据+智能”,即以数据要素结合人工智能为核心的多种技术的结合,从而能加速推动数据要素的商业化。
在数据智能领域,大模型可以以LLM作为核心思考能力,结合行业知识,来快速形成符合行业要求的解决方案,同时提升交互体验,提升智能化产品的开发效率。用户通过使用自然语言进行对话式交互,可以很方便地去加工和操作数据、理解和分解问题、构建和执行解决方案,智能化系统的使用门槛也因此大为降低。
叶新江做了一个生动的比喻,新出现的大模型相当于是一个全新的大脑,输出中枢能力,但它需要手和脚,才能和环境互动、反馈和优化,并完成各种具体的动作。每日互动从成立之初到现在,核心业务逻辑就是“DMP(Data-Machine-People)”,构成“数据积累-数据治理-数据应用”的业务闭环。每日互动以数据思维作为牵引,数据作为生产要素(D),通过大数据、云计算、机器学习等技术治理(M),以实际业务场景的应用为目标(P),实现和挖掘数据价值。通过每日互动打造的数据智能操作系统DiOS(Data Intelligence Operating System),可以把“大脑”的能力输给各行各业使用。

垂直领域更需要“可控大模型”

在AIGC技术中,大模型的训练离不开大规模数据的“投喂”。通过与行业知识结合,大模型能从海量的数据中提取出有价值的信息,为业务决策提供智能支持。然而在实际应用中,叶新江认为这不足以满足具体的业务场景需求,垂直行业更需要“可控大模型”。
叶新江分享,每日互动一直专注数据智能领域,通过充分挖掘数据要素价值来赋能产业。大模型目前缺乏对价值观的判断,每日互动推行的是可控大模型在垂直领域里的应用。比如,中国(温州)数安港为数据安全和应用搭建了一个“港湾”,在数安港的大数据联合计算平台上,多方数据得以进行安全的融合计算,在合规、受控的环境内完成可控的应用,支撑复杂的业务场景实现安全高效的智能应用,优质的垂直数据未来就能在这样的大模型上发挥更大的价值。
叶新江举了一个例子,交警部门非常重视如何把交通高危的事故,特别是事故伤亡率降下来,可控大模型就可以解决这个问题。每日互动和交警部门通过大数据联合计算,首先进行数据洞察,识别出高危人群的特征;然后通过识别出来的特征去建模,对人群进行评级,最后把80%的资源放在前20%的高危人群,进行重点宣教,从而把伤亡率真正降下来,对人民群众的生命和财产安全有很大的提升。

AIGC有序监管正在逐步推进

技术之热必须面对法律之冷。当我们寄希望于AIGC成为新的经济增长点的同时,不得不面对一些由此带来的法律问题:如何对海量的AIGC进行监管?如何平衡AIGC生产过程中的数据利用和个人权益保护?
对此,叶新江表示,“数据作为生产要素,是跟AI结合产生智能以后,才能够发挥其真正的价值。利用大模型需要充分挖掘数据模型的能力,在此意义上,数据安全是利用大模型时必须考虑的问题。数据安全包括保护数据受控使用方面的安全以及数据内容本身是否是真实的、安全的。”
叶新江提到,4月份国家网信办发布了首个国家AIGC监管文件《生成式人工智能服务管理办法(征求意见稿)》,它对AIGC的合法性及权利归属在法律层面做出了明确界定,能够极大程度上消除市场主体的顾虑,进一步推动数字化技术领域的长足发展。

数据和网络安全是我们国家的重要保障,对于AIGC技术的快速发展,目前很多国内外顶尖的专家其实也存在看法上的分歧。
叶新江认为,在看到技术先进性一面的同时,我们也需要关注其另外一面。对于数据智能行业来说,“为大多数人提供美好的服务”是一个可以遵循的价值取向,每日互动还是会积极地去深入了解大模型的能力,更好地使用它,为客户创造更多的价值。在积极拥抱新技术和新趋势的同时,每日互动也将积极和行业各方协作,在保障数据安全的前提下,推动行业的有序发展。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
4月前
|
决策智能 开发者
手把手教你如何用AIGC大模型写一首歌
本文记录了作者用大模型创作歌曲及视频的全过程。
|
5月前
|
机器学习/深度学习 数据采集 自然语言处理
|
2月前
|
Linux Shell API
ollama 大模型部署 工具 | AIGC
Ollama是一个集成了多种大型语言模型的工具,它支持模型的部署、运行以及API的整合和调用。Ollama为不同操作系统的用户提供了便捷的安装方式,并具备丰富的命令行界面(CLI)和API接口,使得用户可以轻松地管理和运行大型模型。【10月更文挑战第1天】
273 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC-Transformer 模型
8月更文挑战第6天
|
5月前
|
自然语言处理
AIGC使用问题之GPT-1如何优化目标函数,如何做模型微调
AIGC使用问题之GPT-1如何优化目标函数,如何做模型微调
|
5月前
|
机器学习/深度学习 运维 算法
「AIGC算法」K-means聚类模型
**K-means聚类模型概览:** - 是无监督学习算法,用于数据集自动分组。 - 算法步骤:初始化质心,分配数据点,更新质心,迭代直至收敛。 - 关键点包括K的选择、初始化方法、收敛性和性能度量。 - 优点是简单快速,适合大样本,但对初始点敏感,需预设K值,且仅适于球形簇。 - 应用场景包括图像分割、市场分析、异常检测等。 - 示例展示了使用scikit-learn对Iris数据集和自定义CSV数据进行聚类。
74 0
「AIGC算法」K-means聚类模型
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC领域中的模型
7月更文挑战第6天
|
4月前
|
人工智能 自然语言处理 搜索推荐
人工智能的奇妙世界:从 AI 到 AIGC,再到大模型与 AGI
人工智能的奇妙世界:从 AI 到 AIGC,再到大模型与 AGI
175 0
|
6月前
|
人工智能 自然语言处理 机器人
【AIGC】大型语言模型在人工智能规划领域模型生成中的探索
【AIGC】大型语言模型在人工智能规划领域模型生成中的探索
110 6
|
5月前
|
机器学习/深度学习 人工智能 大数据
AIGC使用问题之多模态大模型如何升级AIGC的内容创作能力
AIGC使用问题之多模态大模型如何升级AIGC的内容创作能力