魔搭ModelScope社区小助手_社区达人页

个人头像照片
魔搭ModelScope社区小助手
已加入开发者社区54

勋章 更多

个人头像照片
阿里博主
阿里博主
个人头像照片
初入江湖
初入江湖

成就

已发布60篇文章
18条评论
已回答0个问题
0条评论
已发布13个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍

暂无精选文章
暂无更多信息

2025年01月

  • 01.23 10:04:49
    发表了文章 2025-01-23 10:04:49

    统一多模态Embedding, 通义实验室开源GME系列模型

    随着多媒体应用的迅猛发展,用户产生的数据类型日益多样化,不再局限于文本,还包含大量图像、音频和视频等多模态信息。这为信息检索带来了前所未有的挑战与机遇。传统的信息检索模型多关注单一模态,如仅对文本或图像进行分析和搜索。
  • 01.22 10:27:36
    发表了文章 2025-01-22 10:27:36

    Deepseek开源R1系列模型,纯RL助力推理能力大跃升!

    近期Deepseek正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。
  • 01.22 10:25:08
    发表了文章 2025-01-22 10:25:08

    OpenCSG开源SmolTalk Chinese数据集

    近年来,人工智能(AI)领域尤其是自然语言处理(NLP)技术的迅猛发展,正在深刻改变着各行各业的运作模式。从智能客服到内容生成,从自动翻译到智能搜索,NLP技术的广泛应用使得语言模型在全球范围内的重要性日益凸显。与此密切相关的预训练模型(Pre-trained Models),凭借在海量数据上的训练积累了丰富的知识,成为NLP技术进步的核心支柱。然而,预训练模型的成功在很大程度上依赖于其背后数据集的质量。
  • 01.21 10:06:27
    发表了文章 2025-01-21 10:06:27

    VITA-1.5: 迈向GPT-4o级实时视频-语音交互

    近期,由南京大学和腾讯优图推出的VITA-1.5在魔搭开源。VITA-1.5支持视频,音频,文本输入,以及音频输出。
  • 01.20 10:42:09
    发表了文章 2025-01-20 10:42:09

    OpenCSG开源最大中文合成数据集Chinese Cosmopedia

    近年来,生成式语言模型(GLM)的飞速发展正在重塑人工智能领域,尤其是在自然语言处理、内容创作和智能客服等领域展现出巨大潜力。
  • 01.20 10:41:19
    发表了文章 2025-01-20 10:41:19

    通义千问团队开源全新的过程奖励模型PRM!

    近年来,大型语言模型(LLMs)在数学推理方面取得了显著进展,但它们仍可能在过程中犯错误,如计算错误或逻辑错误,导致得出不正确的结论;即使最终答案正确,这些强大的模型也可能编造看似合理的推理步骤,这削弱了 LLMs 推理过程的可靠性和可信度。
  • 01.20 10:39:50
    发表了文章 2025-01-20 10:39:50

    魔搭社区每周速递(1.5-1.18)

    🙋魔搭ModelScope本期社区进展:新增3239个模型,711个数据集,192个创新应用, 16篇内容
  • 01.20 10:38:17
    发表了文章 2025-01-20 10:38:17

    ModelScope魔搭25年1月版本发布月报

    随着2025年帷幕的缓缓拉开,ModelScope团队怀着新年新气象的美好期许,为广大开发者带来了1月份的重磅更新。
  • 01.17 11:24:36
    发表了文章 2025-01-17 11:24:36

    MiniCPM-o 2.6:流式全模态,端到端,多模态端侧大模型来了!

    MiniCPM-o 2.6 是 MiniCPM-o 系列的最新、性能最佳模型。该模型基于 SigLip-400M、Whisper-medium-300M、ChatTTS-200M 和 Qwen2.5-7B 构建,共 8B 参数,通过端到端方式训练和推理。相比 MiniCPM-V 2.6,该模型在性能上有了显著提升,并支持了实时语音对话和多模态流式交互的新功能。
  • 01.17 11:14:09
    发表了文章 2025-01-17 11:14:09

    InternLM3开源发布!4T数据达到18T效果,成本省75%,首度融合深度思考与对话能力!

    1月15日,上海人工智能实验室对书生大模型进行重要版本升级,书生·浦语3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。仅使用4T训练数据的InternLM3-8B-Instruct,其综合性能超过了同量级开源模型,节约训练成本75%以上;同时,InternLM3首次在通用模型中实现了常规对话与深度思考能力融合,可应对更多真实使用场景。
  • 01.15 13:44:20
    发表了文章 2025-01-15 13:44:20

    Valley2,基于电商场景的多模态大模型

    Valley2是一种新颖的多模态大型语言模型,旨在通过可扩展的视觉-语言设计增强各个领域的性能,并拓展电子商务和短视频场景的实际应用边界。
  • 01.14 11:07:27
    发表了文章 2025-01-14 11:07:27

    微软phi-4来啦!小模型之光,14B科学、代码等能力超70B模型效果!

    微软研究院的最新成果——Phi-4来啦!近日,微软公布了Phi家族的最新一代模型Phi-4的技术报告,模型同步开源,Phi-4建立在合成数据集、过滤后的公共领域网站数据以及获得的学术书籍和问答数据集的基础上,训练数据量为9.8 T tokens, 目标是确保小模型使用专注于高质量和高级推理的数据进行训练。
  • 01.13 16:14:49
    发表了文章 2025-01-13 16:14:49

    通义千问Qwen征文活动获奖公布

    Qwen征文获奖公布啦!
  • 01.10 10:54:48
    发表了文章 2025-01-10 10:54:48

    共学 | 2025年,更加有效地搭建Agent

    2024年末,Anthropic写了一篇叫做“Building effective Agents”的文章,针对如何有效的搭建Agent,常见Agent工作流程的几种范式,以及对现在的Code Agent工作模式做了详细的解读。本文结合cookbook+ModelScope的免费Qwen API做了一些中文示例的实践,来更好的理解这篇文章。
  • 01.09 09:53:32
    发表了文章 2025-01-09 09:53:32

    DashInfer-VLM,多模态SOTA推理性能,超vLLM!

    DashInfer-VLM是一个针对于视觉多模态大模型VLM的推理架构,特别优化了Qwen VL模型的推理加速,DashInfer-VLM和其他的VLM的推理加速框架最大的区别是, 它把VIT部分和LLM部分进行了分离,并且VIT和LLM的运行是并行运行,不互相干扰。
  • 01.08 10:58:34
    发表了文章 2025-01-08 10:58:34

    麦橘超然上线魔搭社区,免费生图和训练,文末返图有奖

    麦橘超然是麦橘制作的基于Flux.1的模型,可以生成高度摄影写实和富有光影感的图片,尤其擅长表现人物的脸部和肌肤细节。麦橘之前的作品麦橘写实是各大文生图开源站点最受欢迎的模型之一。
  • 01.07 11:07:48
    发表了文章 2025-01-07 11:07:48

    使用 modelscope-studio 构建你的 Gradio 应用

    modelscope-studio是一个基于 Gradio 的三方组件库,它可以为开发者提供更定制化的界面搭建能力和更丰富的组件使用形式。
  • 01.07 10:48:23
    发表了文章 2025-01-07 10:48:23

    TransferTOD:利用LLM解决TOD系统在域外场景槽位难以泛化的问题

    任务型对话系统旨在高效处理任务导向的对话,如何利用任务型对话系统准确、高效、合理地完成信息采集的工作一直是一项关键且具有挑战性的任务。
  • 01.06 10:31:16
    发表了文章 2025-01-06 10:31:16

    魔搭社区每周速递(12.29-1.4)

    魔搭ModelScope本期社区进展:828个模型,72个数据集,61个创新应用,9篇内容
  • 01.03 20:40:49
    发表了文章 2025-01-03 20:40:49

    AI电影从这个LoRA开始:魔搭AIGC1月赛题公布&12月赛题获奖作品新鲜出炉

    魔搭社区LoRA创意挑战赛月度赛第三期来啦! 1月赛题揭晓:电影风格模型训练大赛
  • 01.03 16:54:26
    发表了文章 2025-01-03 16:54:26

    智谱发布GLM-OS概念及Agent产品,CogAgent-9B模型开源助力GUI交互场景

    11月29日,智谱正式提出 GLM-OS 概念,并发布 AutoGLM 和 GLM-PC 两款 Agent 产品。近期GLM-PC 的基座模型—— CogAgent-9B 开源,供社区进一步开发。
  • 01.03 16:53:16
    发表了文章 2025-01-03 16:53:16

    人人都是音乐家!中科大&科大讯飞重磅开源OpenMusic:音乐生成更高质量,更有乐感

    提出了一种质量感知训练范式,使模型在训练过程中能够感知数据集的质量,从而在音乐性(美学角度)和音频质量方面实现卓越的音乐生成效果。
  • 01.02 15:30:05
    发表了文章 2025-01-02 15:30:05

    新年课程开启:手把手教学,0基础5次课程学会搭建无限拓展的AI应用

    你是否想过自己也能动手搭建一个AI应用?现在,这个目标触手可及!

2024年12月

  • 发表了文章 2025-01-23

    统一多模态Embedding, 通义实验室开源GME系列模型

  • 发表了文章 2025-01-22

    Deepseek开源R1系列模型,纯RL助力推理能力大跃升!

  • 发表了文章 2025-01-22

    OpenCSG开源SmolTalk Chinese数据集

  • 发表了文章 2025-01-21

    VITA-1.5: 迈向GPT-4o级实时视频-语音交互

  • 发表了文章 2025-01-20

    通义千问团队开源全新的过程奖励模型PRM!

  • 发表了文章 2025-01-20

    OpenCSG开源最大中文合成数据集Chinese Cosmopedia

  • 发表了文章 2025-01-20

    魔搭社区每周速递(1.5-1.18)

  • 发表了文章 2025-01-20

    ModelScope魔搭25年1月版本发布月报

  • 发表了文章 2025-01-17

    MiniCPM-o 2.6:流式全模态,端到端,多模态端侧大模型来了!

  • 发表了文章 2025-01-17

    InternLM3开源发布!4T数据达到18T效果,成本省75%,首度融合深度思考与对话能力!

  • 发表了文章 2025-01-15

    Valley2,基于电商场景的多模态大模型

  • 发表了文章 2025-01-14

    微软phi-4来啦!小模型之光,14B科学、代码等能力超70B模型效果!

  • 发表了文章 2025-01-13

    通义千问Qwen征文活动获奖公布

  • 发表了文章 2025-01-10

    共学 | 2025年,更加有效地搭建Agent

  • 发表了文章 2025-01-09

    DashInfer-VLM,多模态SOTA推理性能,超vLLM!

  • 发表了文章 2025-01-08

    麦橘超然上线魔搭社区,免费生图和训练,文末返图有奖

  • 发表了文章 2025-01-07

    使用 modelscope-studio 构建你的 Gradio 应用

  • 发表了文章 2025-01-07

    TransferTOD:利用LLM解决TOD系统在域外场景槽位难以泛化的问题

  • 发表了文章 2025-01-06

    魔搭社区每周速递(12.29-1.4)

  • 发表了文章 2025-01-03

    AI电影从这个LoRA开始:魔搭AIGC1月赛题公布&12月赛题获奖作品新鲜出炉

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
滑动查看更多