阿里云存储受邀参加北京站「源创会」,解析智能存储基于大模型的产品能力提升

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 8 月 26 日,以 “AI 大模型与底层技术探索” 为主题的源创会北京站在北京中关村创业大街圆满举办。会上,阿里云智能高级技术专家马俊凯发表了《智能存储基于大模型的产品能力提升》主题演讲,详解了大语言模型对于智能存储的影响。

8 月 26 日,源创会北京站在北京中关村创业大街圆满举办。本期源创会以 “AI 大模型与底层技术探索” 为主题,邀请到学界、业界多位讲师分享其在 AI 方面的研究成果和经验。

北京站「源创会」合影.png

座无虚席的现场


图灵教育、机械工业出版社、阿里云存储共送出 18 本书做奖品🧧


合作伙伴

源创会传统 “披萨”(吃到披萨的小伙伴快来留个言证明下)

演讲回顾

演讲回放:

https://weixin.qq.com/sph/AXtGMa 上集(需在手机微信中打开此链接)

https://weixin.qq.com/sph/AqQKDE 下集(需在手机微信中打开此链接)

 

BentoML 软件工程师赵申阳发表《OpenLLM:开源大语言模型落地实践》主题演讲。赵申阳介绍,许多企业想要把模型部署在自己的应用中,但各种版本的大模型层出不穷,所以企业一直希望使用最新的大模型,那就需要不断更新代码,需要要投入大量的资源与精力。此外,大模型的使用也会带来 LLM 幻觉,安全性、隐私问题等等,许多企业更希望定制自己的大模型。BentoML 所做的事情便是一键 / 一行(代码)切换大模型。赵申阳详细介绍了可用于构建 AI 应用程序的开源框架 OpenLLM,OpenLLM 支持对主流 ML 框架 / 库的开箱即用、灵活且可定制、内置支持分布式部署以实现可伸缩性、支持 BentoCloud 无服务器部署。



如何让高效地利用已有文件,挖掘文件数据中的价值?这个问题在大模型时代,已经有了最新解。随着大语言模型的飞速发展,各类大语言模型展现出了出色的对话能力与任务求解能力,为各类智能应用提供了丰富的想象空间。阿里云智能高级技术专家马俊凯发表了《智能存储基于大模型的产品能力提升》主题演讲,详解了大语言模型对于智能存储的影响。以阿里云智能存储体系为例,其结合自身业务,引入 “通义千问” 大模型、多模态模型等推出了智能文档助手、语义搜索、内容生成等功能,提供了诸如文档润色、文档续写、文档摘要、语气改写、文档翻译等智能文档能力;文档、图片的跨模态搜索能力。同时结合 x-oss-process 为用户提供了更加便捷的图片处理、文档编辑方式。



通用大模型可以取代为特定任务定制训练的专属模型吗?在可能不远的未来,人机如何合作?如果会取代,那么基于大模型的以人为本的人机合作场景可能是什么样子的?


这是在 ChatGPT 公测之后,韩文娟提出的三点思考,彼时韩文娟已经加入了北京交通大学交通大数据与人工智能教育部重点实验室。在这次的源创会上,北京交通大学计算机与信息技术学院副教授韩文娟发表《利用大模型推动交通领域的智能应用》主题演讲,详解其研究成果。针对上述三个问题,韩文娟和其团队分别做了基于 ChatGPT 的信息抽取工具、人机合作的标注平台以及交通领域基于大型预训练模型的司法判决系统,证明了交通大模型和知识图谱技术结合,可以构造出一个可解释、可追溯、可控的系统。最终在今年 7 月,在交通行业大模型方面,韩文娟所带领的团队发布了国内外首款综合交通大模型 TransGPT,可以实现交通安全教育、智能出行助手、智能交通管理、智能交通规划、交通事故报告和分析、交通政策研究等。



天工大模型商业化产品总监袁梓焜发表《基于数据边界洞察 AI 应用落地与演进趋势》主题演讲。袁梓焜指出,AIGC≈泛 UGC,它不局限于视觉和语言内容,还应该包括肢体、神态、意识与逻辑。而泛 UGC 的三种形式智能涌现、逻辑推理、条件反射分别对应人的三种反应:创意脑暴、分析思考、不假思索。这三种反应也可以称为三种数据类型,对应到不同用户行为之上,则会体现不同的价值。因此,搞清楚数据边界对于大模型的落地应用有非常大的影响。而在 AI 技术可行性边界中,数据压缩度与人类对齐是目前主要卡点。袁梓焜介绍,天工大模型已经能够实现智能涌现,能够实现 20 轮次以上用户交互,最高支持 1 万字以上文本对话。7 月 14 日,公司与国内领先的互动娱乐服务提供商 “映宇宙” 就 AI 技术服务事项达成合作协议,此次合作标志着 “天工” 大模型在互联网社交行业应用的正式落地。



虽然大模型市场非常火热,但普通的创业者和工程师很难有机会直接训练大模型,那么普通人机会在哪里?LLM agent 被认为是一个优势途径。WasmEdge 社区经理夏歌发表《如何用 Serverless 的方式构建 LLM Agent》主题演讲,介绍了几种常见的 LLM agent,第一种是 AI agent,如 MetaGPT、Auto-GPT。第二种是 Co-pilot agent。夏歌也分享了一个 AI agent 框架 flows.network,可以用 Serverless 的方式部署 co-pilot Agent,从而用户无需运行自己的服务器来侦听触发器和事件,并对操作进行身份验证(例如,将结果发送到团队的私有 Slack Channel)。工程师只需要关注业务逻辑即可。在 AI 代理中,Flow 函数可以轻松访问所有领先的商业和开源 LLM(例如 GPT4、Claude2、PaLM2、llama2)和生成图像模型。你可以轻松创建利用模型的能力与世界交互的 AI Agent。



当下,大模型与向量检索技术,也已经渗入数据库运维中,提供了一种新的运维方式。爱可生向量数据库研发经理苏鹏发表《智能运维交互的创新实践》主题演讲。苏鹏介绍,基于大模型 + 向量数据库的智能运维解决方案,可以提高运维效率,通过智能化的方法,可以自动化处理常见的运维问题,大幅提高运维效率;降低运维成本,通过自动化运维,减少对人工的依赖,从而降低企业的人力成本;强化故障预防,通过大模型的预测能力,可以预测潜在的故障和问题,从而实现从被动应对向主动预防的转变。爱可生也提出了基于大模型 + 向量数据库的 SQL 开发管控解决方案,可实现数据清洗、向量转换与检索、模型微调等技术。



各位演讲嘉宾的分享也赢得了现场观众的喝彩,分享结束后,多位观众积极向讲师提问,深度交流。

北京站「源创会」现场交流.png

相关文章
|
17天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
75 2
|
21天前
|
机器学习/深度学习 安全 大数据
揭秘!企业级大模型如何安全高效私有化部署?全面解析最佳实践,助你打造智能业务新引擎!
【10月更文挑战第24天】本文详细探讨了企业级大模型私有化部署的最佳实践,涵盖数据隐私与安全、定制化配置、部署流程、性能优化及安全措施。通过私有化部署,企业能够完全控制数据,确保敏感信息的安全,同时根据自身需求进行优化,提升计算性能和处理效率。示例代码展示了如何利用Python和TensorFlow进行文本分类任务的模型训练。
61 6
|
24天前
|
人工智能
歌词结构的巧妙安排:写歌词的方法与技巧解析,妙笔生词AI智能写歌词软件
歌词创作是一门艺术,关键在于巧妙的结构安排。开头需迅速吸引听众,主体部分要坚实且富有逻辑,结尾则应留下深刻印象。《妙笔生词智能写歌词软件》提供多种 AI 功能,帮助创作者找到灵感,优化歌词结构,写出打动人心的作品。
|
29天前
|
存储 Java
深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。
【10月更文挑战第16天】本文深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。HashSet基于哈希表实现,添加元素时根据哈希值分布,遍历时顺序不可预测;而TreeSet利用红黑树结构,按自然顺序或自定义顺序存储元素,确保遍历时有序输出。文章还提供了示例代码,帮助读者更好地理解这两种集合类型的使用场景和内部机制。
38 3
|
30天前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
25天前
|
人工智能
写歌词的技巧和方法全解析:开启你的音乐创作之旅,妙笔生词智能写歌词软件
怀揣音乐梦想,渴望用歌词抒发情感?掌握关键技巧,你也能踏上创作之旅。灵感来自生活点滴,主题明确,语言简洁,韵律和谐。借助“妙笔生词智能写歌词软件”,AI辅助创作,轻松写出动人歌词,实现音乐梦想。
|
21天前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
8天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
|
21天前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
65 3
|
1月前
|
人工智能 前端开发 JavaScript
拿下奇怪的前端报错(一):报错信息是一个看不懂的数字数组Buffer(475) [Uint8Array],让AI大模型帮忙解析
本文介绍了前端开发中遇到的奇怪报错问题,特别是当错误信息不明确时的处理方法。作者分享了自己通过还原代码、试错等方式解决问题的经验,并以一个Vue3+TypeScript项目的构建失败为例,详细解析了如何从错误信息中定位问题,最终通过解读错误信息中的ASCII码找到了具体的错误文件。文章强调了基础知识的重要性,并鼓励读者遇到类似问题时不要慌张,耐心分析。

热门文章

最新文章

推荐镜像

更多