ModelScope模型即服务-视频-阿里云开发者社区

Dev-Talk

|

视频

EasyPhoto+PAI-DSW体验世界名画AIGC写真创作

EasyPhoto 是一个Webui UI插件，用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现，支持低代码操作、自定义风格，让更多开发者可以灵活地开发自己的风格化的艺术照生成。本教程基于阿里云人工智能PAI产品快速启动EasyPhoto，实现低代码开发个性化AI真人写真。收到

24653 4 5

ModelScope运营小助手

|

Python

|

视频

3张照片打造专属形象！酷蛙FaceChain解密个人写真开源项目，人人AIGC!

各类AI写真软件由于其精准的个人形象+精美的生成效果引爆了朋友圈传播，证件照满足了用户刚需，古装照等风格照满足了用户“美照”的需求。达摩院开放视觉团队推出了开源版本，希望结合开源社区开发者的力量，可以让图片应用更有趣、更好玩、也有更多应用场景。

14351 5 7

阿里云OpenVI

|

达摩院视频直播开发者

|

视频

达摩院OpenVI开源Talk No.3：Modelscope 视觉检测&关键点系列模型与应用介绍

本期视频分为4个部分展开，主要介绍了Modelscope—CV模型概览、视觉检测系列模型与应用、视觉关键点系列模型与应用、未来计划&展望。

27535 2 2

开发者小助理

|

视频

三分钟视频教你一键修复老照片找回曾经的美好记忆

【场景应用】可以应用于老照片、手机图片、老视频等素材的修复。【数据集链接】数据集：https://www.modelscope.cn/datasets/baiguan18/image-portrait-enhancement-dataset/summary模型文件：https://www.modelscope.cn/models/damo/cv_gpen_image-portrait-enhancement/summary

50215 2 5

来自：计算机视觉版块

modelscope

|

视频

MNN推理框架将大模型放进移动端设备，并达到SOTA推理性能！

588 0 0

开发者小助理

|

视频

万物识别：教你一行代码通识万物

通用模型介绍模型文件https://modelscope.cn/models/damo/cv_resnest101_general_recognition/files

33813 6 9

来自：计算机视觉版块

阿里云开发者

|

11月前

|

视频

支付宝率先接入！魔搭社区上线「MCP广场」与1400款MCP服务

4月15日，中国第一AI开源社区魔搭（ModelScope）推出全新MCP广场，上架千余款热门的MCP服务，包括支付宝、MiniMax等全新MCP服务在魔搭独家首发。魔搭社区为AI开发者提供丰富的MCP服务及调试工具，并支持第三方平台集成和调用，通过开源开放的方式加速Agent及AI应用的创新和落地。

605 0 0

modelscope

|

视频

MNN推理框架将大模型放进移动端设备，并达到SOTA推理性能！

324 0 0

Dev-Talk

|

视频

用Modelscope！一网打尽各种文本分类模型

文本分类模型介绍数据集：https://www.modelscope.cn/datasets/DAMO_NLP/BQ_Corpus/summaryhttps://www.modelscope.cn/datasets/DAMO_NLP/ChineseSTS/summaryhttps://www.modelscope.cn/datasets/DAMO_NLP/LCQMC/summary模型文件：https://modelscope.cn/models/damo/nlp_structbert_sentence-similarity_chinese-base/files

11215 1 1

modelscope

|

视频

捣鼓AI做一本情绪拉满的2025夸夸日历

313 0 0

阿里云

|

视频

如何基于开源大模型搭建自己的智能体？

阿里云AI Agent开源！

10621 7 8

modelscope

|

视频

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

306 1 1

Dev-Talk

|

视频

文本生成视频大模型

2022云栖大会现场阿里达摩院牵头退出 AI模型社区魔搭ModelScope 讲师/嘉宾简介：王九牛：达摩院计算机视觉算法专家

1059 1 1

来自：计算机视觉版块

Dev-Talk

|

视频

封神榜模型上新揭秘姜子牙通用大模型v3

6489 3 3

开发者小助理

|

视频

多模态问答模型带你实现高阶人机交流

【场景应用】能够和机器自动进行各种类型的多模态问答，可以应用到各种人机交互的场景【数据集链接】数据集：https://modelscope.cn/datasets/modelscope/vqa_trial/summary模型文件：https://modelscope.cn/models/damo/mplug_visual-question-answering_coco_large_en/files

1315 3 4

modelscope

|

视频

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

312 0 0

modelscope

|

视频

AI赋能大学计划，优秀作品展示

313 0 0

modelscope

|

视频

AI赋能大学计划，优秀作品展示

312 0 0

ModelScope运营小助手

|

视频

视频生成模型 VideoComposer

VideoComposer是由阿里巴巴研发的可控视频生成框架，其可以让用户更灵活地使用文本条件、空间条件和时序条件来生成视频，比如使用草图、深度图或运动向量等多个组合条件合成目标视频，极大地提高了视频灵活性和可控性。本项目相比于之前的开源项目主要增加了无水印数据训练，可使得生成的视频没有水印。此外，本项目目前只支持文本+深度图+Style方便体验。

10104 1 1

通义小二

|

机器学习/深度学习人工智能算法

|

视频

ModelScope 理解编辑视觉模型

ModelScope 理解编辑枧觉模型内容介绍，包含理解类模型，编辑类模型等内容分享

605 0 0

来自：计算机视觉版块

Dev-Talk

|

视频

快准狠预训练模型分词，ModelScope是怎么做的

数据集：https://modelscope.cn/datasets/dingkun/chinese_word_segmentation_pku/summaryhttps://modelscope.cn/datasets/dingkun/chinese_word_segmentation_pku/summary模型文件：https://modelscope.cn/models/damo/nlp_structbert_word-segmentation_chinese-base/files

505 0 0

Dev-Talk

|

视频

喂，能听清吗？别问了，我有智能降噪！

智能降噪简介数据集：https://modelscope.cn/datasets/modelscope/ICASSP_2021_DNS_Challenge/summary"模型文件：https://modelscope.cn/models/damo/speech_frcrn_ans_cirm_16k/files

24880 1 1

来自：语音版块

汀丶人工智能

|

机器学习/深度学习人工智能算法

|

视频

AI绘画前沿应用分享，看看大神们的模型应用有多逆天

1121 53 55

开发者小助理

|

计算机视觉

|

视频

一秒变身！一键生成N次元虚拟卡通形象！

【场景应用】头像/通用图片的卡通化特效生成，广泛用于智能AI创作、社交娱乐、人物隐私保护等场景【数据集链接】数据集：https://modelscope.cn/datasets/modelscope/human_face_portrait_compound_dataset/summary模型文件：https://modelscope.cn/models/damo/cv_unet_person-image-cartoon_compound-models/files

57500 3 10

来自：计算机视觉版块

Dev-Talk

|

视频

2022世界人工智能大会——大规模预训练模型主题论坛

大规模预训练模型展示了一种通用的人工智能方式。而令大模型真正成为下一代人工智能的基础建设，离不开“算法、算力、数据”的突破；也离不开产学研届共同以更加开放的姿态创造共享、互惠的新生态。本次“大规模预训练模型”主题论坛由阿里巴巴集团主办，将围绕“大规模预训练模型的创新、落地和开源开放”展开，将探讨的边界延伸至算法模型、大数据及训练框架等方向，同时展示国内大国的创新技术成果。讲师/嘉宾简介上海市副秘书长—庄木弟阿里巴巴资深副总裁/达摩院副院长/IEEE Fellow—周靖人澜舟科技创始人兼CEO/中国计算机学会副理事长/创新工场首席科学家—周明深势科技创始人 & 首席科学家—张林峰清华大学计算机系副主任—唐杰 IDEA研究院讲席科学家—张家兴达摩院研究员—黄非复旦大学计算机学院教授—邱锡鹏阿里云智能研究员—林伟达摩院资深算法专家—杨红霞 IDEA研究院讲席科学家—张家兴达摩院资深算法专家—黄松芳澜舟科技首席产品官—李京梅

20624 0 0

Dev-Talk

|

视频

达摩院大模型技术交流会

阿里巴巴达摩院前沿自然语言处理预训练模型体系——AliceMind系统化揭秘，全方位了解其背景介绍、算法能力、工作成果、工程实践及业务落地应用。1.达摩院AliceMind算法团队专家亮相直播，带你深入走近VQA Challenge首超人类的大规模多模态预训练技术——AliceMind-MMU，了解其背后的技术工作及基于电商场景的落地案例；解读与阿里云计算平台PAI团队合作的最新成功——基于稀疏的大规模语言模型落地方案的的前沿进展和最佳实践。2.达摩院高级技术专家带你走进大模型落地的背后，从工程侧详细探讨超大规模语言模型落地过程中的体系建设。3.达摩院AliceMind团队 x 阿里云计算平台事业部合作业务落地结果首次发布，看基于预训练模型的QA生成算法如何在大数据场景的落地。讲师/嘉宾简介出品人：黄松芳博士达摩院资深算法专家，深度语言模型体系AliceMind团队负责人。负责超大规模多模态预训练模型的技术研发和行业应用。英国爱丁堡大学博士，加入阿里巴巴之前，曾在IBM研究院工作10多年。嘉宾：徐海洋达摩院专家算法工程师个人简介：主要负责大规模多模态预训练工作，毕业于东南大学，曾就职滴滴AI LABS，在国际顶级会议ACL，EMNLP，IJCAI，SIGIR，InterSpeech等发表论文10多篇，参与开源项目AliceMind，DELTA。谭传奇达摩院算法专家个人简介：北航-MSRA联合培养博士生，2019年毕业后加入阿里巴巴达摩院，先后参与医疗NLP和语言模型方向研究，研究方向有信息抽取、阅读理解、语言模型等，目前负责阿里巴巴深度语言模型体系AliceMind中大规模语言模型（PLUG）的落地工作。曾在MS-MARCO、TREC PM、TREC CT等国际权威评测获得冠军，在ICLR、NeurIPS、ACL、EMNLP、NAACL、AAAI、IJCAI、WWW等国际会议发表论文20余篇。张志成达摩院高级技术专家个人简介：张志成，阿里巴巴达摩院机器智能高级技术专家，普渡大学硕士，专注人工智能领域的算法与工程落地，曾负责大型智能建筑项目中的能源优化决策系统的算法设计和平台系统研发，负责图像识别和视频追踪在图片与视频广告投放中的算法训练和相关系统设计，目前在达摩院负责nlp语言模型平台的建设和维护。管正雄阿里云高级算法工程师个人简介：专注于AIOps领域的算法研究与落地，感兴趣的算法方向有：时序异常检测、根因定位、NLP相关等。目前在阿里云计算平台大数据基础工程技术团队，以AIOps算法侧的角色为业务团队带来增益。

1681 2 2

modelscope

|

视频

极致的显存管理！6G显存运行混元Video模型

408 0 0

modelscope

|

视频

Qwen开源视觉推理模型QVQ，更睿智地看世界！

319 0 0

指剑

|

视频

模型争霸，花落谁家

AI热潮席卷全球，语言大模型(LLM)主导的生成式AI(GenAI)必将成为未来几年最为重要的生产工具之一，各大科研机构、企业、开源团队纷纷推出各自的语言大模型，其中有通用语言大模型，也有专注于某些领域的语言大模型，因其侧重点不一，其使用效果也是不一样的，那么笔者将通过本篇文章带您体验由阿里云魔搭社区联合港中文大学(深圳)共同推出的中文竞技场大模型测评，通过6个不同领域来测试不同模型的效果。站内博文：https://developer.aliyun.com/article/1329834

406 3 3

Dev-Talk

|

视频

通义千问开源

通义千问开源：

1094 2 2

Dev-Talk

|

视频

ONE-PEACE：探索通往无限模态的通用表征模型

王鹏达摩院高级算法工程师

2941 0 0

来自：多模态版块

Dev-Talk

|

视频

达摩院表格—理解大模型STAR，带你玩转表格问答

表格问答模型介绍数据集：https://modelscope.cn/datasets/yuchen/CoSQL/summary模型文件：https://modelscope.cn/models/damo/nlp_star_conversational-text-to-sql/summary

1553 0 0

Dev-Talk

|

视频

中文CLIP上线啦！8行代码助你快速上手图文检索

图文检索简介模型文件：https://www.modelscope.cn/models/damo/multi-modal_clip-vit-base-patch16_zh/summary

64332 2 3

来自：多模态版块

Dev-Talk

|

视频

如何当好人类的第三只眼？看见语音，快速准确又省钱

50743 1 1

来自：语音版块

PolarDB-Evangelist

|

SQL 机器学习/深度学习关系型数据库

|

视频

pg4ml 机器学习框架系列课程：实现细节、XOR 模型案例（上）

pg4ml 机器学习框架是基于 PostgreSQL v13 实现的、使用 plpgsql 编写的机器学习框架，本次讲解的实验环境基于PolarDB-PG开源数据库。本次分享主要介绍框架的实现细节，并构建XOR两层网络的模型案例，包括数据集、XOR分类的案例与原理、神经网络节点、训练任务结构与执行等内容。

939 1 2

Dev-Talk

|

视频

阿里研究院@从理论到应用：论道认知智能丨CCF C³活动基于超大规模预训练模型的小样本和零样本学习

9月24日，CCF C³活动来到阿里研究院，齐聚来自各行业的企业CTO、高级技术人才和资深学者，共同探讨企业人工智能从感知智能向认知智能阶段发展的意义。活动开始前，与会嘉宾参观了阿里巴巴集团北京展区，现场活动由CCF副秘书长、亿邦动力CEO王超主持。CCF副理事长、创新工场首席科学家、澜舟科技创始人周明做了开场致辞，并代表CCF为活动承办方阿里研究院颁发CCF C³活动承办单位感谢牌。周明表示，CCF C³活动，希望加强企业界和企业界之间、企业界和学术界之间的沟通交流，让不同文化相互碰撞，互相取长补短。阿里研究院副院长安筱鹏在开场致辞中说，阿里巴巴既是商业的阿里，也是科技的阿里，致力于由商业和技术双轮驱动，成为的全球数字科技领先的公司。苏中在主题报告中介绍了阿里在大模型技术领域的尝试。苏中指出，人的优势是可以举一反三，进行小样本，甚至零样本的学习；而机器要拥有这样的认知能力，就要通过海量数据来进行预训练。当模型的规模不断扩大，出现百亿、万亿参数规模的大模型技术，通过算力和海量数据，给计算机提升认知智能能力“打开了窗户”。

476 0 0

魏红斌

|

视频

向量检索服务测评

DashVector + ModelScope 玩转多模态检索

363 0 0

ModelScope运营小助手

|

视频

揭秘酷蛙FaceChain开源项目

9097 1 2

阿里云OpenVI

|

达摩院视频直播开发者

|

视频

达摩院OpenVI开源Talk No.2：Modelscope底层视觉模型与应用

本视频分享了GAN、扩散模型、Transformer模型，适用于图像超分辨率、图像上色、图像补全、图像修复等API能力上。

5290 0 0

阿里云OpenVI

|

达摩院视频直播开发者

|

视频

达摩院OpenVI开源Talk No.1：Modelscope理解编辑视觉模型简介

本期视频主要介绍了图像理解类模型、图像编辑类模型，还有其他更多模型。

7192 3 3

PolarDB-Evangelist

|

SQL 机器学习/深度学习人工智能

|

视频

pg4ml 机器学习框架系列课程：实现细节、XOR 模型案例（下）

pg4ml 机器学习框架是基于 PostgreSQL v13 实现的、使用 plpgsql 编写的机器学习框架，本次讲解的实验环境基于PolarDB-PG开源数据库。本次分享主要介绍框架的实现细节，并构建XOR两层网络的模型案例，包括计算图和链式求导设计、训练任务的结构与准备、执行、监控、测试验证等内容。

906 0 0

Dev-Talk

|

视频

教你3分钟视频变动漫

视频变动漫简介数据集：https://modelscope.cn/datasets/modelscope/human_face_portrait_compound_dataset/summary模型文件：https://modelscope.cn/models/damo/cv_unet_person-image-cartoon_compound-models/files

62791 0 5

来自：计算机视觉版块

Dev-Talk

|

视频

达摩院对话大模型SPACE助你搞定任务对话

【预训练对话简介】数据集：https://www.modelscope.cn/datasets/modelscope/MultiWoz2.0/summaryhttps://www.modelscope.cn/datasets/modelscope/banking77/summary模型文件：https://www.modelscope.cn/models/damo/nlp_space_dialog-intent-prediction/files

17069 0 0

来自：计算机视觉版块

Dev-Talk

|

视频

大一统模型在这里？快来看OFA如何一个模型搞定各类任务

【参考资料】大一统模型简介数据集：https://modelscope.cn/datasets/modelscope/coco_2014_caption/fileshttps://modelscope.cn/models?name=ofa&page=1%20caption模型文件：https://modelscope.cn/models/damo/ofa_image-caption_coco_large_en/summary

2340 4 4

来自：多模态版块

开发者小助理

|

计算机视觉

|

视频

告别PS，一键抠图不是梦

【场景应用】方便设计师抠图，不需要使用photoshop等工具，实现一键全自动抠图；可以帮助用户换背景，实现多样化玩法。【数据集链接】数据集：https://modelscope.cn/datasets/liujl09/Human_matting_testing_dataset/summary模型文件：https://modelscope.cn/models/damo/cv_unet_image-matting/files

56823 3 5

来自：计算机视觉版块

modelscope

|

视频

HelloMeme:充分利用 SD1.5 基模的理解能力，实现表情与姿态的迁移

220 0 0

modelscope

|

视频

AI赋能大学计划，优秀作品展示

273 1 1

汀丶人工智能

|

机器学习/深度学习人工智能算法

|

视频

基于实时模型强化学习的无人机自主导航

实时模型强化学习是一种机器学习技术，它可以在无人机的实时环境中学习，并且可以根据环境的变化做出相应的调整。在无人机自主导航中，实时模型强化学习可以用于训练无人机的导航模型，以使其能够在复杂环境中自主导航。具体来说，实时模型强化学习可以通过以下步骤实现：环境建模：建立无人机周围环境的模型，包括地形、障碍物、气象等信息。状态估计：根据环境模型，估计无人机当前的位置和姿态。动作选择：根据估计的位置和姿态，选择最优的动作来控制无人机。动作执行：根据选择的动作，控制无人机执行相应的操作。反馈调整：根据无人机的实际表现，不断调整动作执行的参数，以提高导航的精度和鲁棒性。细化一下：建立状态空间：将无人机所处的环境抽象成一个状态空间，其中每个状态都对应着无人机所处的位置、速度、加速度等信息。定义动作空间：定义无人机可执行的动作集合，例如上升、下降、前进、后退等。设计奖励函数：根据任务需求和目标设定，设计一个奖励函数，用于评估每个状态和执行的动作所获得的收益。该函数应该能够激励无人机朝着预期的目标方向移动，并避免不良行为。进行强化学习训练：利用在线学习等方法，让无人机通过与环境交互来调整策略并优化奖励函数。这样可以使无人机逐渐学会最佳的决策方案，以满足不同的飞行任务。实时执行导航任务：一旦训练完成，无人机就可以在实时环境中根据感知到的状态信息做出决策，并按照最优策略执行自主导航任务。基于实时模型强化学习的无人机自主导航可以通过以下方式实现：实时模型强化学习算法：使用深度学习、神经网络等技术，训练无人机的导航模型，以实现自主导航。无人机传感器数据：无人机需要配备多种传感器，如GPS、IMU、LiDAR等，以获取周围环境的信息。实时数据处理：无人机需要实时获取传感器数据，并对数据进行处理，以实现实时模型强化学习。控制器设计：无人机需要设计相应的控制器，以实现实时模型强化学习的控制。实时模型强化学习控制器：使用实时模型强化学习算法，设计无人机的控制器，以实现实时模型强化学习的控制。总之，基于实时模型强化学习的无人机自主导航是一种具有广泛应用前景的技术，可以提高无人机在复杂环境中的导航精度和鲁棒性。

735 0 0

Dev-Talk

|

视频

人体描边大师5分钟提高班

人体关键点检测数据集：https://www.modelscope.cn/datasets/modelscope/body_2d_keypoints_test_dataset/files模型文件：https://www.modelscope.cn/models/damo/cv_hrnetv2w32_body-2d-keypoints_image/files/pytorch_model.pt

119606 1 2

来自：计算机视觉版块

Dev-Talk

|

视频

机器打工人头件事先听懂再说话

语音识别简介模型文件：https://www.modelscope.cn/models/damo/speech_paraformer_asr_nat-zh-cn-16k-common-vocab8358-tensorflow1/files

14042 0 0

来自：语音版块

最新

文章

视频

问答

推荐

EasyPhoto+PAI-DSW体验世界名画AIGC写真创作

3张照片打造专属形象！酷蛙FaceChain解密个人写真开源项目，人人AIGC!

达摩院OpenVI开源Talk No.3：Modelscope 视觉检测&关键点系列模型与应用介绍

三分钟视频教你一键修复老照片 找回曾经的美好记忆

MNN推理框架将大模型放进移动端设备，并达到SOTA推理性能！

万物识别：教你一行代码通识万物

支付宝率先接入！魔搭社区上线「MCP广场」与1400款MCP服务

MNN推理框架将大模型放进移动端设备，并达到SOTA推理性能！

用Modelscope！一网打尽各种文本分类模型

捣鼓AI做一本情绪拉满的2025夸夸日历

如何基于开源大模型搭建自己的智能体？

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

文本生成视频大模型

封神榜模型上新 揭秘姜子牙通用大模型v3

多模态问答模型带你实现高阶人机交流

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

AI赋能大学计划，优秀作品展示

AI赋能大学计划，优秀作品展示

视频生成模型 VideoComposer

ModelScope 理解编辑视觉模型

快准狠预训练模型分词，ModelScope是怎么做的

喂，能听清吗？别问了，我有智能降噪！

AI绘画前沿应用分享，看看大神们的模型应用有多逆天

一秒变身！一键生成N次元虚拟卡通形象！

2022世界人工智能大会——大规模预训练模型主题论坛

达摩院大模型技术交流会

极致的显存管理！6G显存运行混元Video模型

Qwen开源视觉推理模型QVQ，更睿智地看世界！

模型争霸，花落谁家

通义千问开源

ONE-PEACE：探索通往无限模态的通用表征模型

达摩院表格—理解大模型STAR，带你玩转表格问答

中文CLIP上线啦！8行代码助你快速上手图文检索

如何当好人类的第三只眼？看见语音，快速准确又省钱

pg4ml 机器学习框架系列课程：实现细节、XOR 模型案例（上）

阿里研究院@从理论到应用：论道认知智能丨CCF C³活动 基于超大规模预训练模型的小样本和零样本学习

向量检索服务测评

揭秘酷蛙FaceChain开源项目

达摩院OpenVI开源Talk No.2：Modelscope底层视觉模型与应用

达摩院OpenVI开源Talk No.1：Modelscope理解编辑视觉模型简介

pg4ml 机器学习框架系列课程：实现细节、XOR 模型案例（下）

教你3分钟视频变动漫

达摩院对话大模型SPACE助你搞定任务对话

大一统模型在这里？快来看OFA如何一个模型搞定各类任务

告别PS，一键抠图不是梦

HelloMeme:充分利用 SD1.5 基模的理解能力，实现表情与姿态的迁移

AI赋能大学计划，优秀作品展示

基于实时模型强化学习的无人机自主导航

人体描边大师5分钟提高班

机器打工人头件事先听懂再说话

ModelScope模型即服务

活跃用户

相关产品

三分钟视频教你一键修复老照片找回曾经的美好记忆

封神榜模型上新揭秘姜子牙通用大模型v3

阿里研究院@从理论到应用：论道认知智能丨CCF C³活动基于超大规模预训练模型的小样本和零样本学习