ModelScope内容运营小助手_个人页

ModelScope内容运营小助手

文章

164

问答

视频

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

发表了文章 2024-07-15

消费级显卡微调可图Kolors最佳实践！

近期，快手开源了一种名为Kolors（可图）的文本到图像生成模型，该模型具有对英语和汉语的深刻理解，并能够生成高质量、逼真的图像。
发表了文章 2024-07-12

绘梦有形，快手开源「可图 Kolors」，等你来玩

近期，快手开源了名为Kolors（可图）的文本到图像生成模型，该模型具有对英语和汉语的深刻理解，并能够生成高质量、逼真的图像。
发表了文章 2024-07-11

社区供稿 | 源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

在人工智能领域，大型语言模型的发展日新月异，它们在自然语言处理、机器翻译、智能助手等多个领域展现出了前所未有的能力。
发表了文章 2024-07-10

理解时间戳的视频理解大模型CogVLM2开源！视频生成、视频摘要等任务有力工具！

随着大型语言模型和多模态对齐技术的发展，视频理解模型在通用开放领域也取得了长足的进步。
发表了文章 2024-07-09

开源VLM新标杆 InternVL 2.0 怎么用？部署、微调尽在魔搭社区！

7月4日下午，世界人工智能大会科学前沿论坛，上海人工智能实验室OpenGVLab发布了InternVL 2.0 版本，中文名书生·万象。
发表了文章 2024-07-08

书生·浦语2.5开源，推理能力再创新标杆，怎么玩都在这里了！

上海人工智能实验室秉持“以持续的高质量开源赋能创新”理念，在为社区始终如一地提供高质量开源模型的同时，也将继续坚持免费商用授权。
发表了文章 2024-07-08

阿里通义音频生成大模型 FunAudioLLM 开源！

声音包含丰富的个体特征及情感情绪信息，对话作为人类最常使用亲切自然的交互模式，是连接人与智能世界至关重要的环节。
发表了文章 2024-07-04

可控细节的长文档摘要，探索开源LLM工具与实践

本文通过将文档分为几部分来解决这个问题，然后分段生成摘要。在对大语言模型进行多次查询后，可以重建完整的摘要。通过控制文本块的数量及其大小，我们最终可以控制输出中的细节级别。
发表了文章 2024-07-04

人类偏好对齐训练技术解析

大型语言模型（LLMs）通过在大量文本数据集上进行无监督预训练，获得丰富的语言模式和知识，这一阶段训练后的模型被称为base model。
发表了文章 2024-07-02

Florence-2，小模型推进视觉任务的统一表征

Florence-2是一种新颖的视觉基础模型，具有统一的、基于提示的表示，可用于各种计算机视觉和视觉语言任务。
发表了文章 2024-07-01

谷歌开源Gemma2！魔搭社区推理、微调最佳实践教程

Google面向全球研究人员和开发者发布并开源 Gemma 2 大语言模型！本次Gemma 2 系列为轻量级开放模型，提供9B和27B参数两种尺寸，采用全新的架构设计，性能表现优异。
发表了文章 2024-06-27

GigaSpeech 2：三万小时东南亚多语种语音识别开源数据集发布

GigaSpeech 2 是一个持续扩展的、多领域多语言的大规模语音识别语料库，旨在促进低资源语言语音识别领域的发展和研究。
发表了文章 2024-06-26

开源模型破局OpenAI服务限制，15分钟灵活搭建RAG和Agent应用

今天，我们做了两个实验，目标在15分钟内，完成下载社区的开源模型，部署成API，替换LlamaIndex中RAG和LangChain中OpenAI接口Agent的最佳实践，并取得符合预期的结果。
发表了文章 2024-06-25

Modelscope-Agent 增强RAG能力：（一）多策略召回、多模态召回

Modelscope-Agent是魔搭GPTs 开源的实现方案的底层框架，基于chatbot允许用户通过聊天、直接配置的方式进行agent的定制生成，可以允许用户使用自定义知识库以及接入多工具的能力。
发表了文章 2024-06-24

MimicBrush：奇迹画刷，重新定义局部重绘

图像编辑是一项实用而又具有挑战性的任务，因为用户的需求多种多样，其中最困难的部分之一是准确描述编辑后的图像应该是什么样子。在MimicBrush这项工作中，提出了一种新的编辑形式，称为模仿编辑，以帮助用户更方便地发挥创造力。
发表了文章 2024-06-24

让大模型更懂你的情绪——通义实验室与中科院自动化所联合开源中英双语共情语音对话模型BLSP-Emo

BLSP-Emo模型展示了情感智能在人机交互中的重要性，未来的多模态模型将更加注重情感的识别和表达，使得机器能够更加准确地理解和回应用户的情感状态，甚至生成富有情感的语音反馈。同时，BLSP-Emo展示了将副语言信号对齐到大语言模型语义空间的可能性，我们期待着更加人性化、更具有共情力的对话交互模型的出现。
发表了文章 2024-06-21

ModelScope联手OpenDataLab：直接调用7000+开源数据集，赋能AI模型加速研发

魔搭社区和OpenDatalab浦数合作，共同开启一场模型与数据的深度融合，旨在为中国开发者打造更加高效、开放的AI体验。
发表了文章 2024-06-20

魔搭社区GGUF模型怎么玩！看这篇就够了

近期，Qwen2系列模型家族发布了系列GGUF格式模型。通过llama.cpp/Ollama等生态的发展，很多大语言模型都支持GGUF格式，极大地简化了大语言模型的应用流程，让即便是模型领域的初学者，只有一台CPU笔记本，也能轻松上手顶尖的AI技术。
发表了文章 2024-06-19

Multi-Agent实践第9期: 多智能体的升级体验

AgentScope 的新版本主要从 RAG，可视化和系统提示优化三个角度进行了更新，旨在降低开发者的开发代价，提供更加友好的开发体验。
发表了文章 2024-06-14

ToolBench指标提升8.25%！魔搭社区让Qwen2 成为你的智能体好帮手

随着千问2.0的发布，魔搭社区在第一时间上线了千问2全系列模型。我们注意到，千问2模型在通用能力上已经非常强悍，然而有时候用户需要使用模型在自己的私有场景上搭建起智能体调用流程，这时就有可能遇到对于特定场景调用不良的情况，在这种情况下，用户对于千问2模型进行二次训练并提升智能体精度是非常有必要的。
发表了文章 2024-06-13

Multi-Agent实践第8期：轻松拖拽搭建多智能体应用

AgentScope Workstation令多智能体应用的搭建变得轻而易举，只需简单拖拽操作，每位用户都能快速打造出丰富多彩的应用。
发表了文章 2024-06-12

新Siri解锁万能Agent？魔搭开源移动端框架Mobile-Agent-v2抢先体验！

在刚结束的苹果全球开发者大会WWAC上，Apple家族AI全家桶「Apple Intelligence」亮相，库克宣布个人智能系统将应用于新版本的 iPhone、iPad 和 Mac 操作系统。
发表了文章 2024-06-07

社区供稿 | OpenVINO™ 助力 Qwen 2 —— 开启大语言模型新时代

就在刚刚，阿里魔搭社区发布了全新的 Qwen 2 系列模型，作为 Qwen 及魔搭社区的重要合作伙伴，OpenVINO™ 一直致力于赋能开发者高效搭建人工智能解决方案，助力大规模语言模型的性能提升和应用扩展。
发表了文章 2024-06-07

你好，Qwen2！

今天，通义千问团队带来了Qwen2系列模型，Qwen2系列模型是Qwen1.5系列模型的重大升级。包括了...
发表了文章 2024-06-06

智谱AI GLM4开源！支持多模态&长序列，魔搭推理、微调最佳实践来啦！

GLM-4-9B是智谱AI推出的新一代预训练模型GLM-4系列的开源版本，它在多个数据集上的测试中表现出高绩效，包括语义理解、数学问题解决、推理和代码理解等方面。GLM-4-9B模型有四个变体：基础版GLM-4-9B（8K）、对话版GLM-4-9B-Chat（128K）、超长上下文版GLM-4-9B-Chat-1M（1M）和多模态版GLM-4V-9B-Chat（8K）。用户可以通过魔搭社区提供的链接体验这些模型，包括在CPU上运行的版本和支持vLLM推理的版本。
发表了文章 2024-06-03

ChatTTS：专为对话场景设计的文本转语音模型，底模开源！

最近，开源社区杀出一匹文本转语音领域的黑马——ChatTTS，在Github上仅4天斩获11.2k star。
发表了文章 2024-05-31

高能力全透明双语大语言模型MAP-Neo完全开源，开放所有细节！

近年来，大型语言模型 (LLMs) 在各种任务中取得了前所未有的性能提升。然而，由于商业利益，最强大的模型（如 GPT、Gemini 和Claude）只能通过API访问，并未公开训练细节。
发表了文章 2024-05-29

YOLOv10发布，性能效率双提升，魔搭社区最佳实践来啦！

YOLO（You Only Look Once）系列目标检测框架，由于其在计算成本与检测性能之间实现了有效平衡，故而成为实时物体检测领域的标杆。
发表了文章 2024-05-28

Data Is All You Need! 生成式图文对数据最佳实践，数据集魔搭开源！

23年10月底，OpenAI发布了 DALL-E 3 的技术报告《 Improving Image Generation with Better Captions 》，这篇技术报告的重点放在了 DALL-E 3 通过高质量的、详细的、生成式图像 caption（文本描述）进行训练后，提升 prompt following 能力。
发表了文章 2024-05-28

PAI x ModelScope：在PAI使用ModelScope模型

在当前的人工智能领域，特别是大语言模型、文生图等领域，基于预训练模型完成机器学习模型的开发部署已成为重要的应用范式，开发者们依赖于这些先进的开源预训练模型，以简化机器学习应用的开发并加速创新。
发表了文章 2024-05-27

微软开源4.2B参数多模态SLM模型Phi-3-vision，魔搭社区推理、微调实战教程来啦！

在 Microsoft Build 2024 上，微软持续开源了 Phi-3 系列的新模型们。包括 Phi-3-vision，这是一种将语言和视觉功能结合在一起的多模态模型。
发表了文章 2024-05-24

社区供稿 | 更长、更强、更开放，零一万物 Yi-1.5 系列开源模型发布一周广受好评

5 月 13 日，零一万物 Yi 系列开源模型全新升级为 Yi-1.5。相较于去年 11 月的开源版本，这次的 Yi-1.5 在保持原 Yi 系列模型优秀的通用语言能力的前提下，通过增量训练 500B 高质量 token，大幅提高了数学逻辑、代码能力。
发表了文章 2024-05-24

魔搭开源推理引擎 DashInfer，助力CPU服务器解锁大模型超强推理

ModelScope推出了预训练大语言模型（LLM）推理引擎DashInfer，采用C++ Runtime编写，提供C++和Python语言接口，具有生产级别的高性能表现，适用于多种CPU架构，包括x86和ARMv9。DashInfer支持连续批处理（Continuous Batching）和多NUMA推理（NUMA-Aware），能够充分利用服务器级CPU的算力，为推理14B及以下的LLM模型提供更多的硬件选择。该项工作已开源。
发表了文章 2024-05-23

ModelScope-Agent框架再升级！新增一键配置多人聊天，配套开源多智能体数据集和训练

ModelScope-Agent是魔搭社区推出的适配开源大语言模型（LLM）的AI Agent（智能体）开发框架，借助ModelScope-Agent，所有开发者都可基于开源 LLM 搭建属于自己的智能体应用。在最新升级完Assistant API和Tool APIs之后，我们又迎来了多智能体聊天室的升级，通过几分钟快速配置即可搭建一个全新的聊天室。
发表了文章 2024-05-22

面壁推出超强端侧多模态模型，推理仅需8G显存！

面壁小钢炮 MiniCPM 系列，再次推出超强端侧多模态模型 MiniCPM-Llama3-V 2.5，且支持 30+ 多种语言
发表了文章 2024-05-21

CogVLM2: 智谱开源新一代多模态大模型！

智谱·AI推出了新一代 CogVLM2 系列模型，并开源了使用 Meta-Llama-3-8B-Instruct 构建的两个模型。与上一代CogVLM开源模型相比，CogVLM2系列开源模型有了很多改进...
发表了文章 2024-05-20

Compass Arena：司南x魔搭携手推出大模型竞技场

从Llama-3的问世，到参数规模空前的MoE模型，再到GPT-4o的震撼发布，大语言模型（LLM）的飞速进步让人目不暇接。然而，随着模型数量的增加，如何客观、公正地评估和比较这些模型的性能，亟待探索与解决的问题。
发表了文章 2024-05-17

大模型量化技术解析和应用

眼看人工智能含智能量越来越高含人量越来越低，是否开始担心自己要跟不上这趟高速列车了？内心是否也充满好奇：大模型背后的奥秘是什么？为何如此强大？它能为我所用吗？哪种技术最适合我的需求？
发表了文章 2024-05-16

社区供稿 | Yuan2.0千亿大模型在通用服务器上的高效推理实现：以NF8260G7服务器为例

浪潮信息联合Intel在IPF大会上发布了可运行千亿参数大模型的AI通用服务器，首次实现了单机通用服务器，即可运行千亿参数大模型。并在发布现场演示了基于NF8260G7服务器进行yuan2.0-102B模型在代码编写、逻辑推理等高难度问题上的实时推理效果，引起了业界广泛的关注。本文将详细解读yuan2.0-102B模型在NF8260G7服务器上进行高效实时推理的原理和技术路径。
发表了文章 2024-05-15

MistoLine-线条魔法，驾驭每一缕创意！

MistoLine 是一个可以适配任意类型线稿，准确性高，稳定性优秀的SDXL-ControlnetNet模型。它可以基于用户输入的任意类型的线稿图（手绘、各类controlnet-line preprocessor、模型线框轮廓等）作为条件，生成高质量图像（短边大于1024px），无需再根据不同线预处理器选择不同的controlnet模型，MistoLine在各类线稿条件下都有较好的泛化能力。
发表了文章 2024-05-11

智能体-Agent能力升级！新增Assistant API & Tools API服务接口

ModelScope-Agent是一个交互式创作空间，它支持LLM（Language Model）的扩展能力，例如工具调用（function calling）和知识检索（knowledge retrieval）。它已经对相关接口进行了开源，以提供更原子化的应用LLM能力。用户可以通过Modelscope-Agent上的不同代理（agent），结合自定义的LLM配置和消息，调用这些能力。
发表了文章 2024-05-14

零一万物Yi-1.5系列模型发布并开源！34B/9B/6B 多尺寸魔搭社区推理微调最佳实践教程来啦！

Yi-1.5是Yi的升级版本。它使用 500B tokens的高质量语料库在 Yi 上持续进行预训练，并在 3M 个多样化的微调样本上进行微调。

暂无更多信息

发表了文章 2024-11-19

冬天到了，用OmniGen生成一个温暖的拥抱
发表了文章 2024-11-18

魔搭社区每周速递（11.10-11.16）
发表了文章 2024-11-18

ModelScope魔搭11月版本发布月报
发表了文章 2024-11-15

基于开源技术的数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s
发表了文章 2024-11-14

智源行业应用大模型挑战赛开启报名！挖掘数据潜能，共创行业新篇
发表了文章 2024-11-13

AI+硬件最新资讯合集（2024-11-11第3期）
发表了文章 2024-11-12

Qwen2.5-Coder深夜开源炸场，Prompt编程的时代来了！
发表了文章 2024-11-12

Open NotebookLM，一键PDF/URL转播客！
发表了文章 2024-11-11

魔搭社区创空间全新支持 Gradio 5
发表了文章 2024-11-11

智源研究院发布千万级多模态指令数据集Infinity-MM：驱动开源模型迈向SOTA性能
发表了文章 2024-11-11

魔搭社区每周速递（10.27-11.09）
发表了文章 2024-11-11

让你的Notebook飞起来！开发体验再上新台阶
发表了文章 2024-11-11

上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData
发表了文章 2024-11-08

AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
发表了文章 2024-11-08

NeurIPS D&B 2024 突破短视频局限！MMBench-Video解读MLLM视频理解能力
发表了文章 2024-11-07

打破文本边界：如何进行多模态RAG评估
发表了文章 2024-11-06

现在，一行命令使用Ollama运行任意魔搭GGUF模型
发表了文章 2024-11-06

AI+硬件最新资讯合集（2024-11-05第2期）
发表了文章 2024-11-05

Meissonic：高效高分辨率文生图重大革新
发表了文章 2024-11-04

社区供稿 | 创作《哈利波特与异界魔书》的过程和心得

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

ModelScope内容运营小助手_个人页

个人介绍

擅长的技术

消费级显卡微调可图Kolors最佳实践！

绘梦有形，快手开源「可图 Kolors」，等你来玩

社区供稿 | 源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

理解时间戳的视频理解大模型CogVLM2开源！视频生成、视频摘要等任务有力工具！

开源VLM新标杆 InternVL 2.0 怎么用？部署、微调尽在魔搭社区！

书生·浦语2.5开源，推理能力再创新标杆，怎么玩都在这里了！

阿里通义音频生成大模型 FunAudioLLM 开源！

可控细节的长文档摘要，探索开源LLM工具与实践

人类偏好对齐训练技术解析

Florence-2，小模型推进视觉任务的统一表征

谷歌开源Gemma2！魔搭社区推理、微调最佳实践教程

GigaSpeech 2：三万小时东南亚多语种语音识别开源数据集发布

开源模型破局OpenAI服务限制，15分钟灵活搭建RAG和Agent应用

Modelscope-Agent 增强RAG能力：（一）多策略召回、多模态召回

MimicBrush：奇迹画刷，重新定义局部重绘

让大模型更懂你的情绪——通义实验室与中科院自动化所联合开源中英双语共情语音对话模型BLSP-Emo

ModelScope联手OpenDataLab：直接调用7000+开源数据集，赋能AI模型加速研发

魔搭社区GGUF模型怎么玩！看这篇就够了

Multi-Agent实践第9期: 多智能体的升级体验

ToolBench指标提升8.25%！魔搭社区让Qwen2 成为你的智能体好帮手

Multi-Agent实践第8期：轻松拖拽搭建多智能体应用

新Siri解锁万能Agent？魔搭开源移动端框架Mobile-Agent-v2抢先体验！

社区供稿 | OpenVINO™ 助力 Qwen 2 —— 开启大语言模型新时代

你好，Qwen2！

智谱AI GLM4开源！支持多模态&长序列，魔搭推理、微调最佳实践来啦！

ChatTTS：专为对话场景设计的文本转语音模型，底模开源！

高能力全透明双语大语言模型MAP-Neo完全开源，开放所有细节！

YOLOv10发布，性能效率双提升，魔搭社区最佳实践来啦！

Data Is All You Need! 生成式图文对数据最佳实践，数据集魔搭开源！

PAI x ModelScope： 在PAI使用ModelScope模型

微软开源4.2B参数多模态SLM模型Phi-3-vision，魔搭社区推理、微调实战教程来啦！

社区供稿 | 更长、更强、更开放，零一万物 Yi-1.5 系列开源模型发布一周广受好评

魔搭开源推理引擎 DashInfer，助力CPU服务器解锁大模型超强推理

ModelScope-Agent框架再升级！新增一键配置多人聊天，配套开源多智能体数据集和训练

面壁推出超强端侧多模态模型，推理仅需8G显存！

CogVLM2: 智谱开源新一代多模态大模型！

Compass Arena： 司南x魔搭携手推出大模型竞技场

大模型量化技术解析和应用

社区供稿 | Yuan2.0千亿大模型在通用服务器上的高效推理实现：以NF8260G7服务器为例

MistoLine-线条魔法，驾驭每一缕创意！

智能体-Agent能力升级！新增Assistant API & Tools API服务接口

零一万物Yi-1.5系列模型发布并开源！34B/9B/6B 多尺寸魔搭社区推理微调最佳实践教程来啦！

冬天到了，用OmniGen生成一个温暖的拥抱

魔搭社区每周速递（11.10-11.16）

ModelScope魔搭11月版本发布月报

基于开源技术的数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s

智源行业应用大模型挑战赛开启报名！挖掘数据潜能，共创行业新篇

AI+硬件最新资讯合集（2024-11-11第3期）

Qwen2.5-Coder深夜开源炸场，Prompt编程的时代来了！

Open NotebookLM，一键PDF/URL转播客！

魔搭社区创空间全新支持 Gradio 5

智源研究院发布千万级多模态指令数据集Infinity-MM：驱动开源模型迈向SOTA性能

魔搭社区每周速递（10.27-11.09）

让你的Notebook飞起来！开发体验再上新台阶

上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData

AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营

NeurIPS D&B 2024 突破短视频局限！MMBench-Video解读MLLM视频理解能力

打破文本边界：如何进行多模态RAG评估

现在，一行命令使用Ollama运行任意魔搭GGUF模型

AI+硬件最新资讯合集（2024-11-05第2期）

Meissonic：高效高分辨率文生图重大革新

社区供稿 | 创作《哈利波特与异界魔书》的过程和心得

PAI x ModelScope：在PAI使用ModelScope模型

Compass Arena：司南x魔搭携手推出大模型竞技场