魔搭城市行 | 南京站 · 「阿里巴巴人工智能大模型&魔搭开源社区交流论坛」成功举办

简介: 2024年1月11日下午,阿里巴巴人工智能大模型及魔搭开源社区交流沙龙 · 南京站在南京软件谷云密城L栋成功举办!


2024年1月11日下午,阿里巴巴人工智能大模型及魔搭开源社区交流沙龙 · 南京站在南京软件谷云密城L栋成功举办!


本次活动由魔搭社区、阿里巴巴通义实验室主办,中国(南京)软件谷科技创新部、南京一八九科创服务有限公司协办,阿里巴巴集团、南京市科学技术局、中国(南京)软件谷管委会作为指导单位。


论坛邀请了来自阿里巴巴大模型领域的算法专家、魔搭社区成员以及南京本地的AI创业公司代表作为分享嘉宾,与现场的70余名开发者展开了深入的讨论,这些参与者来自华为、东软集团、江苏广电、江苏省电子商务协会、南京审计大学、南京航空航天大学等众多企事业单位,涵盖各行业。


这次互动交流不仅为参与者提供了一个学习和分享的平台,也为不同行业的AI开发者和爱好者提供了一个相互启发与合作的机会。



致辞

李嘉平阿里巴巴集团华东有限公司总经理、阿里云智能集团战略发展副总裁



2023年,大模型在全球范围内引发了一场革新人工智能领域的风暴,不仅对上层应用的构建带来了巨大挑战,也对底层模型和框架的开发提出了高要求。软件产业是南京的经济重点之一,去年陈市长参观阿里巴巴南京办公室时,提出希望阿里能够与南京的软件产业携手,在大模型的研究与应用方面展开合作。此次正值魔搭社区积极筹备城市推广之际,基于南京软件产业生态的活力,将南京选定为活动的起始站,通过组织大模型技术干货分享和面对面交流,为更多开发者提供支持。



主题一

阿里巴巴人工智能大模型

通义千问:走向通用人工智能刘天宇  通义千问算法专家 



介绍了通义千问大模型在语言模型、多模态、Agent方面的工作,并着重在模型实现、训练细节、工程优化等技术干货方向展开分享。突出当前通义千问“全尺寸、全模态”的全面拥抱开源的工作,以及阿里云百炼平台提供企业级服务,帮助用户利用通义千问系列模型的推理服务来搭建自己的应用,给大家带来了关于通义千问的全视角认知。



LDM的高清视频生成I2VGen和HiGen视频生成技术解析张士伟  通义实验室多模态视频生成算法专家




介绍了视频生成领域的背景和关键技术的发展时间线,并进一步介绍了通义实验室最新的高清图生视频I2VGen-XL、高清文生视频HiGen两个视频生成模型,以及通义实验室开源的最完备通用视频生成框架VGen(张士伟团队正在进行的工作)。同时也介绍视频生成目前依然还在 鲁棒性、时长、可控性、人体/人像生成效果上存在的挑战,未来VGen也将继续通过开源的方式来和更多开发者共同探讨解决这些挑战的方案。



主题二

ModelScope魔搭社区

魔搭社区整体能力介绍石洪竺  魔搭社区负责人



魔搭社区作为一个开放创新的平台,在推动大模型落地及应用生态建设方面发挥了重要作用。魔搭社区提供各种基础模型和高质量的数据集,支持云上部署和一站式的模型管理,为开发者提供方便的使用体验。


SWIFT:轻量大模型训练推理框架

赵宇泽  魔搭社区框架高级专家



分享了魔搭官方开发的LLM&AIGC训练推理部署一站式开源框架——SWIFT,该框架支持了所有主流LLM的预训练、指令微调、人类对齐训练等多种训练,并提供了对应模型的开源数据集前处理过程和Prompt模板。为方便使用,框架提供了命令行、界面等多种训练推理方式,并可以便捷部署训练后模型,提供VLLM等方式进行部署加速。


ModelScopeAgent:魔搭社区开源Agent框架

周文猛  魔搭社区工程技术负责人



分享了AI Agent目前作为大模型应用最热门的方向之一背后的发展脉络,以及最新的Agent前沿技术,随后重点介绍了ModelScopeAgent的功能和优势。ModelScopeAgent提供了灵活的API注册和开发的能力,可以帮助用户定制业务目标模型。平台支持各种开源和闭源的国产模型,并提供了灵活的功能消耗监测和优化。此外,ModelScopeAgent 还致力于推动中小企业的自主定制和业务创新,提供了丰富的API和开发支持。通过该平台,用户可以轻松地构建复杂的业务应用,并实现最终的业务价值。



主题三

大模型应用开发经验分享

智汇涌现:AIGC应用与探索

刘黄骁烈  江苏汇智智能数字科技有限公司 CTO



汇智智能是隶属于南京汇智互娱集团的一家人工智能创新企业,以“让AI力量成为每个人的天赋”为使命。

汇智智能CTO 刘黄骁烈分享了汇智智能在AIGC领域的探索和发现,首先讨论了AI行业的发展历程和大模型在各个领域的应用场景。他认为AI行业的发展具有持续质量可靠的特点,每一次浪潮都会在AI领域留下一些东西。

随后,提出大模型时代下用户存在“GMONIC困境”(Guide-指导、Notarize-公正、Operate-操作、Measure-衡量、Identify-区分、Catelog-推介),在此困境下,国内大模型服务产业最终需要面向行业用户,需要有落地的产品或服务,解决用户的实际问题,基于此,汇智智能推出了一个AIGC行业社区——智能体平台(https://gnomic.cn), 用以拓展产业边界,让AI力量成为每个人的天赋,助力大模型供应商乘风破浪。


AIGC时代,数字人及智能客服的应用搭建实践

魏佳星  云蝠智能创始人



云蝠智能的核心业务是通过AI外呼、人机协同、可交互数字人、短视频生成等能力为企业提供音频、视频数字员工。

作为阿里校友,云蝠智能创始人魏佳星以创业者的视角带来了大模型时代AI应用开发者的心得分享。魏总讲述了创业初期的思考和选择,以及数字人在各个领域的应用场景,提到智能客服和大模型在业务中的作用和优势,并重点讨论了智能客服和数字人的发展趋势,包括大模型的应用、数字人的重要性、开源方案的选择、数据持续增长的必要性以及未来AI产品的原生引流,同时还提到了成本、效率、安全等问题的挑战和解决方案。



圆桌对话

大模型时代下的技术探索


主持人:魔搭社区生态运营负责人  成晨

嘉宾:

刘天宇  通义千问算法专家

周文猛  魔搭社区工程技术负责人

张士伟  通义实验室多模态视频生成算法专家

赵宇泽  魔搭社区框架高级专家

李雅亮  通义实验室资深算法专家


圆桌环节邀请现场观众一起参与,大家围绕大模型在行业应用中可能遇到的问题,以及如何解决这些问题展开讨论,话题涉及到部署设备、行业数据、模型准确率、算法性能等方面,并提到了多智能体的应用场景和未来发展趋势。



本次沙龙的实况直播收录在“魔搭ModelScope社区”视频号的直播回放中,感兴趣的的小伙伴们可移步观看。

相关文章
|
4月前
|
机器学习/深度学习 人工智能 数据处理
人工智能平台PAI操作报错合集之任务重启后出现模型拆分报错,该怎么办
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
12 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
92 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】线性回归模型:数据结构、算法详解与人工智能应用,附代码实现
线性回归是一种预测性建模技术,它研究的是因变量(目标)和自变量(特征)之间的关系。这种关系可以表示为一个线性方程,其中因变量是自变量的线性组合。
65 2
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】常用的人工智能框架、模型、使用方法、应用场景以及代码实例的概述
人工智能(AI)领域涉及众多框架和模型,这些框架和模型为开发人员提供了强大的工具,以构建和训练各种AI应用。以下是一些常用的人工智能框架、模型、使用方法、应用场景以及代码实例的概述。
115 1
|
4月前
|
机器学习/深度学习 人工智能 算法
【服装识别系统】图像识别+Python+人工智能+深度学习+算法模型+TensorFlow
服装识别系统,本系统作为图像识别方面的一个典型应用,使用Python作为主要编程语言,并通过TensorFlow搭建ResNet50卷积神经算法网络模型,通过对18种不同的服装('黑色连衣裙', '黑色衬衫', '黑色鞋子', '黑色短裤', '蓝色连衣裙', '蓝色衬衫', '蓝色鞋子', '蓝色短裤', '棕色鞋子', '棕色短裤', '绿色衬衫', '绿色鞋子', '绿色短裤', '红色连衣裙', '红色鞋子', '白色连衣裙', '白色鞋子', '白色短裤')数据集进行训练,最后得到一个识别精度较高的H5格式模型文件,然后基于Django搭建Web网页端可视化操作界面,实现用户在界面中
124 1
【服装识别系统】图像识别+Python+人工智能+深度学习+算法模型+TensorFlow
|
4月前
|
搜索推荐 人工智能
人工智能LLM问题之大模型特殊能力如何解决
人工智能LLM问题之大模型特殊能力如何解决
|
4月前
|
人工智能 数据挖掘 机器人
同样是人工智能 客户在哪儿AI和GPT等大模型有什么不同
客户在哪儿AI生产的是企业全历史行为数据,同时还针对ToB企业,提供基于企业全历史行为数据的数据分析服务。
|
4月前
|
搜索推荐 人工智能
人工智能LLM问题之大模型的涌现能力如何解决
人工智能LLM问题之大模型的涌现能力如何解决
|
5月前
|
人工智能 自然语言处理 API
人工智能大模型之开源大语言模型汇总(国内外开源项目模型汇总)
人工智能大模型之开源大语言模型汇总(国内外开源项目模型汇总)
人工智能大模型之开源大语言模型汇总(国内外开源项目模型汇总)

热门文章

最新文章