每日互动(个推)CTO叶新江:AIGC时代,大模型推动数据要素商业化

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
数据安全中心,免费版
简介: 在近期举行的2023数据安全发展大会·数据智能安全与发展论坛上,每日互动(个推)CTO叶新江先生围绕AIGC时代下大模型给大数据企业带来的机遇与挑战进行了深入分享。

ChatGPT在一夜之间火爆互联网,让AIGC受到世界范围内的高度关注。时至今日,AIGC热度持续高涨,各大互联网公司争相布局这一领域。日渐成熟的技术、显著的降本增效优势以及日益增长的市场需求等因素,已经推动AIGC成为互联网公司新一轮必争之地。
在近期举行的2023数据安全发展大会·数据智能安全与发展论坛上,每日互动(个推)CTO叶新江先生围绕AIGC时代下大模型给大数据企业带来的机遇与挑战进行了深入分享。
52af7b4adb7c63ec928f0b8783f786a.jpg
图:每日互动(个推)CTO叶新江在数据智能安全与发展论坛上分享AIGC话题

大模型将推动数据要素商业化

上世纪90年代开始,随着大规模集成电路、芯片技术的突破,个人电脑进入了千家万户。个人电脑能为大家所广泛使用,还有一个核心原因就是,操作系统的出现大大降低了人们操作电脑的难度。也有人将LLM基础下AIGC技术的突破看作是智能操作系统的迭代,认为其标志着多模态智能时代的来临。
犹如之前计算机、互联网的普及给整个人类社会带来巨大的生产和效率的提升,AIGC技术也将会改变人们工作、生活的范式,具有里程碑式的作用。它将整体提升人类的知识水平,而如何更好地使用各种“副驾驶”,将成为未来的竞争重心。实际上,在这样一个时代下,拓宽每个人的认知边界,“学问”(即“学习如何更好地问”)将成为更重要的能力。
对此,叶新江认为在VUCA时代,要突破生产效率,必须有新的能源或能量。而在数据要素市场,这个“能源+能量”就是“数据+智能”,即以数据要素结合人工智能为核心的多种技术的结合,从而能加速推动数据要素的商业化。
在数据智能领域,大模型可以以LLM作为核心思考能力,结合行业知识,来快速形成符合行业要求的解决方案,同时提升交互体验,提升智能化产品的开发效率。用户通过使用自然语言进行对话式交互,可以很方便地去加工和操作数据、理解和分解问题、构建和执行解决方案,智能化系统的使用门槛也因此大为降低。
叶新江做了一个生动的比喻,新出现的大模型相当于是一个全新的大脑,输出中枢能力,但它需要手和脚,才能和环境互动、反馈和优化,并完成各种具体的动作。每日互动从成立之初到现在,核心业务逻辑就是“DMP(Data-Machine-People)”,构成“数据积累-数据治理-数据应用”的业务闭环。每日互动以数据思维作为牵引,数据作为生产要素(D),通过大数据、云计算、机器学习等技术治理(M),以实际业务场景的应用为目标(P),实现和挖掘数据价值。通过每日互动打造的数据智能操作系统DiOS(Data Intelligence Operating System),可以把“大脑”的能力输给各行各业使用。

垂直领域更需要“可控大模型”

在AIGC技术中,大模型的训练离不开大规模数据的“投喂”。通过与行业知识结合,大模型能从海量的数据中提取出有价值的信息,为业务决策提供智能支持。然而在实际应用中,叶新江认为这不足以满足具体的业务场景需求,垂直行业更需要“可控大模型”。
叶新江分享,每日互动一直专注数据智能领域,通过充分挖掘数据要素价值来赋能产业。大模型目前缺乏对价值观的判断,每日互动推行的是可控大模型在垂直领域里的应用。比如,中国(温州)数安港为数据安全和应用搭建了一个“港湾”,在数安港的大数据联合计算平台上,多方数据得以进行安全的融合计算,在合规、受控的环境内完成可控的应用,支撑复杂的业务场景实现安全高效的智能应用,优质的垂直数据未来就能在这样的大模型上发挥更大的价值。
叶新江举了一个例子,交警部门非常重视如何把交通高危的事故,特别是事故伤亡率降下来,可控大模型就可以解决这个问题。每日互动和交警部门通过大数据联合计算,首先进行数据洞察,识别出高危人群的特征;然后通过识别出来的特征去建模,对人群进行评级,最后把80%的资源放在前20%的高危人群,进行重点宣教,从而把伤亡率真正降下来,对人民群众的生命和财产安全有很大的提升。

AIGC有序监管正在逐步推进

技术之热必须面对法律之冷。当我们寄希望于AIGC成为新的经济增长点的同时,不得不面对一些由此带来的法律问题:如何对海量的AIGC进行监管?如何平衡AIGC生产过程中的数据利用和个人权益保护?
对此,叶新江表示,“数据作为生产要素,是跟AI结合产生智能以后,才能够发挥其真正的价值。利用大模型需要充分挖掘数据模型的能力,在此意义上,数据安全是利用大模型时必须考虑的问题。数据安全包括保护数据受控使用方面的安全以及数据内容本身是否是真实的、安全的。”
叶新江提到,4月份国家网信办发布了首个国家AIGC监管文件《生成式人工智能服务管理办法(征求意见稿)》,它对AIGC的合法性及权利归属在法律层面做出了明确界定,能够极大程度上消除市场主体的顾虑,进一步推动数字化技术领域的长足发展。

数据和网络安全是我们国家的重要保障,对于AIGC技术的快速发展,目前很多国内外顶尖的专家其实也存在看法上的分歧。
叶新江认为,在看到技术先进性一面的同时,我们也需要关注其另外一面。对于数据智能行业来说,“为大多数人提供美好的服务”是一个可以遵循的价值取向,每日互动还是会积极地去深入了解大模型的能力,更好地使用它,为客户创造更多的价值。在积极拥抱新技术和新趋势的同时,每日互动也将积极和行业各方协作,在保障数据安全的前提下,推动行业的有序发展。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
22天前
|
机器学习/深度学习 人工智能 自然语言处理
迁移学习:让小数据也能驱动AI大模型
迁移学习:让小数据也能驱动AI大模型
225 99
|
3月前
|
人工智能 自然语言处理 数据可视化
通义灵码保姆级教程:从数据读取、清洗、结合大模型分析、可视化、生成报告全链路
本课程通过通义灵码实现零代码数据分析全流程,涵盖数据读取、清洗、可视化、报告生成及内容仿写,无需编程基础,轻松掌握从CSV导入到PDF报告输出的实战技能。
|
5月前
|
数据可视化 API Swift
全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源
OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。
280 17
|
1月前
|
存储 缓存 负载均衡
LLM推理成本直降60%:PD分离在大模型商业化中的关键价值
在LLM推理中,Prefill(计算密集)与Decode(访存密集)阶段特性不同,分离计算可提升资源利用率。本文详解vLLM框架中的PD分离实现及局限,并分析Dynamo、Mooncake、SGLang等主流方案,探讨KV缓存、传输机制与调度策略,助力LLM推理优化。建议点赞收藏,便于后续查阅。
545 1
|
7月前
|
存储 人工智能 搜索推荐
WiseMindAI:一款AI智能知识库,数据完全本地化,支持文档对话、10+种文档、10+AI大模型等
WiseMindAI 是一款由 Chris 开发的 AI 智能学习助手,支持数据完全本地化存储,确保用户隐私安全。它兼容多种文档格式(如 PDF、Markdown 等),并提供 AI 文档总结、智能笔记、沉浸式翻译、知识卡片生成等功能。此外,WiseMindAI 支持 10+ 大语言模型和自定义 AI 插件,适用于 Windows 和 Mac 平台,支持简体中文、繁体中文及英文。
586 74
WiseMindAI:一款AI智能知识库,数据完全本地化,支持文档对话、10+种文档、10+AI大模型等
|
6月前
|
缓存 人工智能 架构师
释放数据潜力:利用 MCP 资源让大模型读懂你的服务器
MCP(Model Control Protocol)资源系统是将服务器数据暴露给客户端的核心机制,支持文本和二进制两种类型资源。资源通过唯一URI标识,客户端可通过资源列表或模板发现资源,并使用`resources/read`接口读取内容。MCP还支持资源实时更新通知及订阅机制,确保动态数据的及时性。实现时需遵循最佳实践,如清晰命名、设置MIME类型和缓存策略,同时注重安全性,包括访问控制、路径清理和速率限制等。提供的示例代码展示了如何用JavaScript和Python实现资源支持。
723 80
|
6月前
|
运维 监控 数据可视化
产品测评 | 大模型时代下全场景数据消费平台的智能BI—Quick BI深度解析
Quick BI是阿里云旗下的全场景数据消费平台,助力企业实现数据驱动决策。用户可通过连接多种数据源(如本地文件、数据库等)进行数据分析,并借助智能小Q助手以对话形式查询数据或搭建报表。平台支持数据可视化、模板快速构建视图等功能,但目前存在不支持JSON格式文件、部分功能灵活性不足等问题。整体而言,Quick BI在数据分析与展示上表现出强大能力,适合业务类数据处理,未来可在智能化及运维场景支持上进一步优化。
|
7月前
|
人工智能 自然语言处理 数据可视化
大模型+BI:一场关乎企业未来生死的数据智能卡位战 | 【瓴羊数据荟】数据MeetUp第四期
随着大模型技术突破,全球企业迎来数据智能革命。Gartner预测,到2027年,中国80%的企业将采用多模型生成式AI策略。然而,数据孤岛与高门槛仍阻碍价值释放。
271 8
大模型+BI:一场关乎企业未来生死的数据智能卡位战 | 【瓴羊数据荟】数据MeetUp第四期
|
6月前
|
机器学习/深度学习 存储 数据可视化
KG4MM:融合知识图谱与多模态数据预测药物相互作用
本文探讨了用于多模态学习的知识图谱(KG4MM)在药物相互作用(DDI)预测中的应用。知识图谱通过整合药物的分子图像和文本描述,提供结构化先验知识,指导模型关注关键信息。具体实现中,利用图神经网络(GNN)连接知识图谱与多模态数据,通过注意力机制提取最具区分性的特征。以 Goserelin 和 Desmopressin 为例,模型结合直接边关系和共享节点路径,生成透明可解释的预测结果。实验表明,KG4MM 方法显著提升了预测准确性与可解释性,为生物医学领域提供了新思路。
149 0
KG4MM:融合知识图谱与多模态数据预测药物相互作用

热门文章

最新文章