阿里云存储受邀参加北京站「源创会」,解析智能存储基于大模型的产品能力提升

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
对象存储 OSS,恶意文件检测 1000次 1年
简介: 8 月 26 日,以 “AI 大模型与底层技术探索” 为主题的源创会北京站在北京中关村创业大街圆满举办。会上,阿里云智能高级技术专家马俊凯发表了《智能存储基于大模型的产品能力提升》主题演讲,详解了大语言模型对于智能存储的影响。

8 月 26 日,源创会北京站在北京中关村创业大街圆满举办。本期源创会以 “AI 大模型与底层技术探索” 为主题,邀请到学界、业界多位讲师分享其在 AI 方面的研究成果和经验。

北京站「源创会」合影.png

座无虚席的现场


图灵教育、机械工业出版社、阿里云存储共送出 18 本书做奖品🧧


合作伙伴

源创会传统 “披萨”(吃到披萨的小伙伴快来留个言证明下)

演讲回顾

演讲回放:

https://weixin.qq.com/sph/AXtGMa 上集(需在手机微信中打开此链接)

https://weixin.qq.com/sph/AqQKDE 下集(需在手机微信中打开此链接)

 

BentoML 软件工程师赵申阳发表《OpenLLM:开源大语言模型落地实践》主题演讲。赵申阳介绍,许多企业想要把模型部署在自己的应用中,但各种版本的大模型层出不穷,所以企业一直希望使用最新的大模型,那就需要不断更新代码,需要要投入大量的资源与精力。此外,大模型的使用也会带来 LLM 幻觉,安全性、隐私问题等等,许多企业更希望定制自己的大模型。BentoML 所做的事情便是一键 / 一行(代码)切换大模型。赵申阳详细介绍了可用于构建 AI 应用程序的开源框架 OpenLLM,OpenLLM 支持对主流 ML 框架 / 库的开箱即用、灵活且可定制、内置支持分布式部署以实现可伸缩性、支持 BentoCloud 无服务器部署。



如何让高效地利用已有文件,挖掘文件数据中的价值?这个问题在大模型时代,已经有了最新解。随着大语言模型的飞速发展,各类大语言模型展现出了出色的对话能力与任务求解能力,为各类智能应用提供了丰富的想象空间。阿里云智能高级技术专家马俊凯发表了《智能存储基于大模型的产品能力提升》主题演讲,详解了大语言模型对于智能存储的影响。以阿里云智能存储体系为例,其结合自身业务,引入 “通义千问” 大模型、多模态模型等推出了智能文档助手、语义搜索、内容生成等功能,提供了诸如文档润色、文档续写、文档摘要、语气改写、文档翻译等智能文档能力;文档、图片的跨模态搜索能力。同时结合 x-oss-process 为用户提供了更加便捷的图片处理、文档编辑方式。



通用大模型可以取代为特定任务定制训练的专属模型吗?在可能不远的未来,人机如何合作?如果会取代,那么基于大模型的以人为本的人机合作场景可能是什么样子的?


这是在 ChatGPT 公测之后,韩文娟提出的三点思考,彼时韩文娟已经加入了北京交通大学交通大数据与人工智能教育部重点实验室。在这次的源创会上,北京交通大学计算机与信息技术学院副教授韩文娟发表《利用大模型推动交通领域的智能应用》主题演讲,详解其研究成果。针对上述三个问题,韩文娟和其团队分别做了基于 ChatGPT 的信息抽取工具、人机合作的标注平台以及交通领域基于大型预训练模型的司法判决系统,证明了交通大模型和知识图谱技术结合,可以构造出一个可解释、可追溯、可控的系统。最终在今年 7 月,在交通行业大模型方面,韩文娟所带领的团队发布了国内外首款综合交通大模型 TransGPT,可以实现交通安全教育、智能出行助手、智能交通管理、智能交通规划、交通事故报告和分析、交通政策研究等。



天工大模型商业化产品总监袁梓焜发表《基于数据边界洞察 AI 应用落地与演进趋势》主题演讲。袁梓焜指出,AIGC≈泛 UGC,它不局限于视觉和语言内容,还应该包括肢体、神态、意识与逻辑。而泛 UGC 的三种形式智能涌现、逻辑推理、条件反射分别对应人的三种反应:创意脑暴、分析思考、不假思索。这三种反应也可以称为三种数据类型,对应到不同用户行为之上,则会体现不同的价值。因此,搞清楚数据边界对于大模型的落地应用有非常大的影响。而在 AI 技术可行性边界中,数据压缩度与人类对齐是目前主要卡点。袁梓焜介绍,天工大模型已经能够实现智能涌现,能够实现 20 轮次以上用户交互,最高支持 1 万字以上文本对话。7 月 14 日,公司与国内领先的互动娱乐服务提供商 “映宇宙” 就 AI 技术服务事项达成合作协议,此次合作标志着 “天工” 大模型在互联网社交行业应用的正式落地。



虽然大模型市场非常火热,但普通的创业者和工程师很难有机会直接训练大模型,那么普通人机会在哪里?LLM agent 被认为是一个优势途径。WasmEdge 社区经理夏歌发表《如何用 Serverless 的方式构建 LLM Agent》主题演讲,介绍了几种常见的 LLM agent,第一种是 AI agent,如 MetaGPT、Auto-GPT。第二种是 Co-pilot agent。夏歌也分享了一个 AI agent 框架 flows.network,可以用 Serverless 的方式部署 co-pilot Agent,从而用户无需运行自己的服务器来侦听触发器和事件,并对操作进行身份验证(例如,将结果发送到团队的私有 Slack Channel)。工程师只需要关注业务逻辑即可。在 AI 代理中,Flow 函数可以轻松访问所有领先的商业和开源 LLM(例如 GPT4、Claude2、PaLM2、llama2)和生成图像模型。你可以轻松创建利用模型的能力与世界交互的 AI Agent。



当下,大模型与向量检索技术,也已经渗入数据库运维中,提供了一种新的运维方式。爱可生向量数据库研发经理苏鹏发表《智能运维交互的创新实践》主题演讲。苏鹏介绍,基于大模型 + 向量数据库的智能运维解决方案,可以提高运维效率,通过智能化的方法,可以自动化处理常见的运维问题,大幅提高运维效率;降低运维成本,通过自动化运维,减少对人工的依赖,从而降低企业的人力成本;强化故障预防,通过大模型的预测能力,可以预测潜在的故障和问题,从而实现从被动应对向主动预防的转变。爱可生也提出了基于大模型 + 向量数据库的 SQL 开发管控解决方案,可实现数据清洗、向量转换与检索、模型微调等技术。



各位演讲嘉宾的分享也赢得了现场观众的喝彩,分享结束后,多位观众积极向讲师提问,深度交流。

北京站「源创会」现场交流.png

相关文章
|
1月前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
129 2
|
1月前
|
机器学习/深度学习 安全 大数据
揭秘!企业级大模型如何安全高效私有化部署?全面解析最佳实践,助你打造智能业务新引擎!
【10月更文挑战第24天】本文详细探讨了企业级大模型私有化部署的最佳实践,涵盖数据隐私与安全、定制化配置、部署流程、性能优化及安全措施。通过私有化部署,企业能够完全控制数据,确保敏感信息的安全,同时根据自身需求进行优化,提升计算性能和处理效率。示例代码展示了如何利用Python和TensorFlow进行文本分类任务的模型训练。
104 6
|
22天前
|
机器学习/深度学习 人工智能 PyTorch
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。
42 3
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
|
2天前
|
网络协议 安全 网络安全
探索网络模型与协议:从OSI到HTTPs的原理解析
OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据,确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤,以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。 浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤,确保用户与服务器之间的安全通信。
18 1
|
8天前
|
运维 安全 Cloud Native
阿里云云安全中心全面解析
阿里云云安全中心作为一款集持续监测、深度防御、全面分析、快速响应能力于一体的云上安全管理平台,为企业提供了全方位的安全保障。本文将详细介绍阿里云云安全中心的功能、应用场景、收费标准以及购买建议,帮助您更好地了解和利用这一强大的安全工具。
阿里云云安全中心全面解析
|
1月前
|
存储 安全 数据安全/隐私保护
PyPI 存储库中的 JarkaStealer:深入解析与防范措施
PyPI 存储库中的 JarkaStealer:深入解析与防范措施
26 2
|
1月前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
1月前
|
存储 网络协议 安全
30 道初级网络工程师面试题,涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术,帮助小白们充分准备面试,顺利踏入职场
本文精选了 30 道初级网络工程师面试题,涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术,帮助小白们充分准备面试,顺利踏入职场。
87 2
|
1月前
|
存储 安全 Linux
Golang的GMP调度模型与源码解析
【11月更文挑战第11天】GMP 调度模型是 Go 语言运行时系统的核心部分,用于高效管理和调度大量协程(goroutine)。它通过少量的操作系统线程(M)和逻辑处理器(P)来调度大量的轻量级协程(G),从而实现高性能的并发处理。GMP 模型通过本地队列和全局队列来减少锁竞争,提高调度效率。在 Go 源码中,`runtime.h` 文件定义了关键数据结构,`schedule()` 和 `findrunnable()` 函数实现了核心调度逻辑。通过深入研究 GMP 模型,可以更好地理解 Go 语言的并发机制。
|
1月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
303 2

热门文章

最新文章

推荐镜像

更多