|
10月前
|
人工智能 自然语言处理 开发工具
|

Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置

Languine 是一款面向开发者的 AI 翻译工具,支持 100+ 种语言,自动化翻译流程,提升多语言应用开发效率。

344 15
来自: 自然语言处理  版块
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

MarS:微软开源金融市场模拟预测引擎,支持策略测试、风险管理和市场分析

MarS 是微软亚洲研究院推出的金融市场模拟预测引擎,基于生成型基础模型 LMM,支持无风险环境下的交易策略测试、风险管理和市场分析。

349 8
来自: 多模态  版块
|
10月前
|
人工智能 自然语言处理 算法
|

VidTok:微软开源的视频分词器,能够将视频内容转换为视觉 Token

VidTok 是微软开源的一款先进的视频分词器,支持连续和离散分词化,能够高效地将视频内容转换为视觉 Token,适用于多种应用场景。

165 15
来自: 计算机视觉  版块
|
11月前
|
数据采集 存储 自然语言处理
|

魔搭社区每周速递(12.22-12.28)

魔搭ModelScope本期社区进展:1039个模型,128个数据集,63个创新应用,6篇内容。

267 4
|
11月前
|
人工智能 运维 算法
|

资讯 | CodeFuse邀你12月28日参加OSC源创会年终盛典活动

2024年OSC源创会年终盛典将于12月28日在珠海举行,CodeFuse将在主论坛分享《CodeFuse基座模型介绍》并展示最新项目。欢迎扫码报名!

103 0
|
11月前
|

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

209 0
|
11月前
|

【求助】ModelScope Notebook中如何使用conda

在魔搭创建的CPU环境中,虽然在Terminal中可以正常使用miniconda,但在Notebook中无法切换到conda环境,只能选择默认的ipykernel。如何解决这一问题?

222 12
|
11月前
|
人工智能 API 开发工具
|

ModelScope魔搭12月版本发布月报

为了给开发者提供更便捷的开源模型API访问方式,我们正式启动了 ModelScope API-Inference 的公测。在开源工具链方面,我们进行了ModelScope 1.21.0的新版本发布,提供了llamafile的集成以及模型加载/下载链路的优化,SWIFT 3.0大版本也已经合并主干,在这个基础上新模型的支持会更加顺畅与便利。

415 3
|
11月前
|
缓存 人工智能 程序员
|

CodeFuse「编码挑战季」:冲刺最后1个月!MelGeek磁轴键盘、Beats耳机等你来拿~

从1024程序员节起至12月底,CodeFuse「编码挑战季」火热进行中!参与muAgent、MFTCoder、ModelCache、CodeFuse-IDE四个项目的编码挑战,不仅能够深化对CodeFuse项目及开源社区的理解,还能赢取定制周边及高端奖品,如MelGeekMADE68 PRO磁轴键盘、Beats Studio Pro无线蓝牙耳机等。活动期间,开发者可根据任务难度获取积分,兑换丰富奖品。立即加入,让我们一起探索技术的无限可能!

190 11
|
11月前
|
存储 人工智能 数据库
|

Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目

Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。

296 11
来自: 自然语言处理  版块
|
11月前
|
人工智能 API 开发者
|

用 OpenVINO™ 部署 GLM-Edge 全家桶

11月29日,智谱发布了GLM-Edge系列模型,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B、GLM-Edge-V-5B,适用于手机、车机及PC平台。文章介绍了如何使用OpenVINO™工具套件在本地部署这些模型,实现高效的AI任务处理,如聊天与图像理解。提供了详细的环境配置、模型转换与量化、以及具体的应用示例。

330 16
|
12月前
|
人工智能 测试技术 计算机视觉
|

LongLLaVA:香港中文大学推出的多模态上下文混合架构大语言模型

LongLLaVA是由香港中文大学推出的多模态大型语言模型,采用混合架构,结合Mamba和Transformer模块,旨在高效处理大量图像数据。该模型能够在单个A100 80GB GPU上处理多达1000张图像,通过2D池化技术压缩图像token,显著降低计算成本,同时保留关键的空间关系信息。LongLLaVA在视频理解、高分辨率图像分析和多模态代理等应用场景中展现出卓越的性能。

207 5
来自: 多模态  版块
|
12月前
|
人工智能 数据处理 异构计算
|

LongRAG:智谱联合清华和中科院推出的双视角鲁棒检索框架

LongRAG是由智谱、清华大学和中国科学院联合推出的双视角鲁棒检索增强生成框架,专为长文本问答设计。该框架通过混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器等组件,有效解决了长文本问答中的全局上下文理解和事实细节识别难题。LongRAG在多个数据集上表现优异,提供了自动化微调数据构建管道,增强了系统的“指令跟随”能力和领域适应性。

337 1
来自: 自然语言处理  版块
|
12月前
|
人工智能 机器人 信息无障碍
|

11月30日“2024 AI+硬件创新大赛”决赛-杭州西湖体育馆见!

探索AI硬件创新,28强团队决战杭州西湖体育馆

232 1
|
12月前
|
人工智能 JavaScript 数据可视化
|

深入探索 Flux Tools 在 AI 图像创作中的强大功能

Flux Tools 是由 Black Forest Labs 开发的一套先进 AI 图像编辑工具,集成了修补、扩展、深度映射和边缘检测等功能,为用户提供高精度的图像控制能力,广泛应用于照片编辑、数字艺术创作和设计工作等领域,极大提升了创作效率与自由度。

385 3
|
12月前
|
SQL 机器学习/深度学习 人工智能
|

今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!

本文介绍了四个最新的 AI 开源项目,涵盖多模态生成式 AI、自然语言到 SQL 转化、多模态数学推理和复杂逻辑推理等多个领域,为 AI 应用开发提供了丰富的资源和工具。

679 0
来自: 自然语言处理  版块
|
2月前
|
Kubernetes Devops Docker
|

Kubernetes 和 Docker Swarm:现代 DevOps 的理想容器编排工具

本指南深入解析 Kubernetes 与 Docker Swarm 两大主流容器编排工具,涵盖安装、架构、网络、监控等核心维度,助您根据团队能力与业务需求精准选型,把握云原生时代的技术主动权。

219 1
|
4月前
|

送福利!FlowBench客户端首批内测邀请函

魔搭AIGC搭子们,集合啦!ModelScope x FlowBench 团队

158 3
|
6月前
|
并行计算 异构计算 算法框架/工具
|

Funasr GPU2.0.0部署推理,RTF达不到0.0008,连0.0076都达不到。

169 0
来自:语音 版块
|
6月前
|
开发框架 人工智能 安全
|

ModelScope魔搭25年5月发布月报

不知不觉间,日历已经翻过了立夏,而开源模型的世界中似乎并没有春夏秋冬。在刚刚过去的四月份,见证了开源社区又一次蓬勃发展的浪潮。以Qwen3家族为代表,一系列新模型的开源为整个生态注入了新的活力。通过全面覆盖多种规格的 dense 与 MoE 模型架构,Qwen3 首次在开源模型中引入“快思考与慢思考” 双模式的支持,获得了广大开发者的热烈欢迎,成为新一代开源大模型的标杆之作。

242 10
|
7月前
|
物联网 容器
|

“一丹一世界”三等奖 | 绮影录 创作分享

“一丹一世界”三等奖 | 绮影录 创作分享

173 2
|
7月前
|
自然语言处理 并行计算 PyTorch
|

智源开源FlagOS升级:首次实现DeepSeek-R1满血版多种芯片高效快速部署

近日,DeepSeek-R1以低训练成本实现比肩一流模型的高性能并全面开源,引发了海量部署及场景应用,推理计算需求迅猛增长。

198 6
|
7月前
|
机器学习/深度学习 人工智能
|

OmniCam:浙大联合上海交大推出多模态视频生成框架,虚拟导演打造百万级影视运镜

OmniCam是由浙江大学与上海交通大学联合研发的多模态视频生成框架,通过LLM与视频扩散模型结合实现高质量视频生成,支持文本、轨迹和图像等多种输入模态。

154 1
来自: 多模态  版块
|
8月前
|
人工智能 并行计算 异构计算
|

MT-TransformerEngine:国产训练核弹!FP8+算子融合黑科技,Transformer训练速度飙升300%

MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Transformer 模型设计,通过算子融合、并行加速等技术显著提升训练效率,支持 FP8 混合精度训练,适用于 BERT、GPT 等大型模型。

370 10
来自: 科学计算  版块
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
|

今日热门论文推荐:Seedream、LMM-R1、YuE、Gemini Embedding

由Cohere、SEACrowd等机构联手打造,SEA-VL是一个面向东南亚地区的多文化视觉-语言数据集,填补了AI模型在该地区文化细微差别理解上的空白。该工作通过众包、爬取和生成三种方式收集了128万张文化相关图像,结合本地贡献者确保数据的高质量和多样性,推动了更具包容性的AI发展。

199 13
|
8月前
|
机器学习/深度学习 人工智能 缓存
|

MHA2MLA:0.3%数据微调!复旦团队开源推理加速神器,KV缓存狂降96.87%

MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效微调方法,通过引入多头潜在注意力机制(MLA),显著优化基于Transformer的LLM推理效率,降低推理成本。

246 1
来自: 科学计算  版块
|
8月前
|
人工智能 自然语言处理 文字识别
|

解读 | 金融长上下文基准测试FailSafeQA:解锁金融领域LLM真实的审慎性和容错性

近年来,大型语言模型(LLMs)在金融领域的应用如火如荼,从风险分析到客户服务,它们正逐步改变行业的游戏规则。然而,这些模型是否真的足够“靠谱”?面对复杂的金融数据和多变的用户输入,它们还能保持精准和稳健吗?

183 8
|
8月前
|
人工智能 自然语言处理 自动驾驶
|

AVD2:清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2 是由清华大学联合多所高校推出的自动驾驶事故视频理解与生成框架,结合视频生成与事故分析,生成高质量的事故描述、原因分析和预防措施,显著提升自动驾驶系统的安全性和可靠性。

146 6
来自: 计算机视觉  版块
|
8月前
|
机器学习/深度学习 人工智能 缓存
|

SepLLM:开源大模型加速神器!400万Token长文本推理提速50%,告别OOM噩梦

SepLLM 是一个用于加速大语言模型的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率,适用于长文本处理和多场景部署。

227 7
来自: 自然语言处理  版块
|
9月前
|
人工智能 自然语言处理 数据可视化
|

OneCode 接入 DeepSeek:开启代码开发新纪元

OneCode 接入 DeepSeek,带来自然语言聊天式基础建模、本地代码工程无缝结合、图生代码功能全线升级及 AI 模型代码直接导入等新特性,极大提升开发效率与体验。预计第二季度推出开源版本,进一步推动开发者社区的开放与创新。这些改进使开发更加高效、便捷和智能,助力代码开发进入新纪元。

122 0
来自: 自然语言处理  版块
|
9月前
|
存储 人工智能 算法
|

Magic 1-For-1:北大联合英伟达推出的高质量视频生成量化模型,支持在消费级GPU上快速生成

北京大学、Hedra Inc. 和 Nvidia 联合推出的 Magic 1-For-1 模型,优化内存消耗和推理延迟,快速生成高质量视频片段。

397 3
来自: 计算机视觉  版块
|
9月前
|
人工智能 算法 云计算
|

0元!使用魔搭免费算力,基于Qwen基座模型,复现DeepSeek-R1

近期,随着DeepSeek-R1爆火,学术界掀起一股复现DeepSeek-R1的浪潮,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。

623 5
|
9月前
|
存储 人工智能 缓存
|

DiffSplat:输入文本或图像,2秒内生成3D建模!北大联合字节开源3D建模生成框架

DiffSplat 是由北京大学和字节跳动联合推出的一个高效 3D 生成框架,能够在 1-2 秒内从文本提示或单视图图像生成高质量的 3D 高斯点阵,并确保多视图下的一致性。

386 19
来自: 计算机视觉  版块
|
10月前
|
人工智能 自然语言处理 JavaScript
|

微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切

微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。

771 15
来自: 自然语言处理  版块
|
10月前
|
机器学习/深度学习 人工智能 测试技术
|

ParGo:字节与中山大学联合推出的多模态大模型连接器,高效对齐视觉与语言模态

ParGo 是字节与中山大学联合推出的多模态大模型连接器,通过全局与局部视角联合,提升视觉与语言模态的对齐效果,支持高效连接、细节感知与自监督学习。

219 6
来自: 多模态  版块
|
10月前
|
机器学习/深度学习 人工智能 监控
|

Uni-AdaFocus:清华大学开源高效视频理解框架,根据视频内容动态分配计算资源

Uni-AdaFocus 是清华大学推出的高效视频理解框架,通过自适应聚焦机制动态调整计算资源分配,显著提升视频处理效率。

166 6
来自: 多模态  版块
|
10月前
|
机器学习/深度学习 人工智能 算法
|

Edicho:多图像一致性编辑,支持即插即用无需训练,快速实现风格转换

Edicho 是蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法,基于扩散模型,支持即插即用,无需额外训练,适用于多种图像编辑任务。

207 8
来自: 计算机视觉  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14399
内容
6
活动
3684
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互