|
7月前
|
数据可视化 API Swift
|

全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源

OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。

348 17
|
7月前
|
传感器 供应链 物联网
|

农业单亩价值创造功能技术集成的概念与内涵

农业单亩价值创造的技术集成,通过系统性创新打破传统单一模式,融合现代科技与生态理念,提升资源效率、经济效益和生态价值。其核心在于技术协同,实现精准农业、智能装备和生物强化等多维联动,推动经济、生态和社会价值统一。同时,注重资源集约化与循环化利用,延伸产业链并升级价值链,从短期高产转向长期可持续发展。政策与制度创新支撑技术普惠,未来需因地制宜解决技术适配性和成本收益平衡问题,重塑农业评价体系,实现高质量发展。

207 11
|
7月前
|
人工智能 搜索推荐 小程序
|

AI故事随心绘:多主体ID保留,个性化生成

近期通义实验室提出了一种AnyStory的方法,旨在实现高质量的个性化文本到图像生成,支持单个和多个主体。

246 1
|
8月前
|
前端开发 语音技术
|

面向对话语音合成的模态间与模态内上下文交互建模

面向对话语音合成的模态间与模态内上下文交互建模

217 15
|
8月前
|
存储 人工智能 编解码
|

"一丹一世界"二等奖 | MAJICFLUS_新浮世 创作分享

"一丹一世界"二等奖 | MAJICFLUS_新浮世 创作分享

236 2
|
8月前
|
人工智能 自然语言处理 运维
|

超强辅助!Bolt.diy 自然语言建站工具一键云端部署方案

Bolt.diy 是一款从创意到部署的极速开发工具,支持多语言模型(如 OpenAI、DeepSeek 等)灵活适配,满足不同任务需求。其模块化架构提供高度定制化能力,可扩展自定义服务与私有模型。全栈开发流程覆盖代码生成、调试、版本管理到一键部署,内置数据库管理与 API 自动生成功能。智能化辅助工具实时分析代码错误并提供建议,帮助开发者高效理解复杂项目。基于云原生平台 CAP 构建,支持快速部署与实时预览,适用于快速原型设计、教育及企业级开发等场景。

201 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

RWKV-7革新序列建模,Impossible Videos探索超现实,Creation-MMBench点燃创意火花: 今日论文

由 RWKV 项目(Linux Foundation AI & Data)和 EleutherAI 等机构提出的 RWKV-7 "Goose",是一种全新的序列建模架构。它在30亿参数规模上刷新了多语言任务的下游性能纪录,媲美顶级英文语言模型,同时仅需恒定内存和推理时间。核心创新包括广义delta规则和上下文学习率优化,超越了传统Transformer的表达能力。作者还开源了3.1万亿token的多语言数据集和代码,助力社区研究。

229 3
|
9月前
|
人工智能 算法 新能源
|

琶洲算法大赛首场高校巡回赛中山大学站圆满收官

近日,琶洲算法大赛高校巡回赛全国首站在中山大学珠海校区圆满收官。琶洲算法大赛定位为国际性算法领域权威赛事,旨在推动人工智能技术创新与产业融合‌,举办三届以来,琶洲已经评选出41位琶洲领军算法师,落地人才团队170个,极大程度扩充丰富了本地算法人才数量和层级。

110 2
|
9月前
|

有偿创建 CosyVoice2-0.5B 大模型

有偿创建 CosyVoice2-0.5B 大模型,希望有人能帮忙在创空间 创建一个这样的模型,官方的老出502

555 22
|
9月前
|
人工智能 搜索推荐 开发者
|

Kiss3DGen:基于图像扩散模型的3D资产生成框架

Kiss3DGen是一个创新的3D资产生成框架,通过重新利用预训练的2D图像扩散模型,高效生成、编辑和增强3D对象,支持文本到3D、图像到3D等多种生成任务。

408 5
来自: 多模态  版块
|
10月前
|
自然语言处理 API 开发者
|

强强联合,开源中文DeepSeek-R1蒸馏数据集联合魔搭社区,一起来训练中文版推理模型!

近期,刘聪NLP开源了开源中文DeepSeek-R1(满血)蒸馏数据集包括SFT版本和普通版本,话不多说,先放数据下载链接。

551 1
|
10月前
|
人工智能 监控 自动驾驶
|

Migician:清北华科联手放大招!多图像定位大模型问世:3秒锁定跨画面目标,安防监控迎来AI革命!

Migician 是北交大联合清华、华中科大推出的多模态视觉定位模型,支持自由形式的跨图像精确定位、灵活输入形式和多种复杂任务。

324 3
来自: 计算机视觉  版块
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

ModelScope深度学习项目低代码开发

低代码开发平台通过丰富的预训练模型库、高度灵活的预训练模型和强大的微调训练功能,简化深度学习项目开发。以阿里魔搭为例,提供大量预训练模型,支持快速迭代与实时反馈,减少从头训练的时间和资源消耗。开发者可轻松调整模型参数,适应特定任务和数据集,提升模型性能。ModelScope平台进一步增强这些功能,提供模型搜索、体验、管理与部署、丰富的模型和数据资源、多模态任务推理及社区协作,助力高效、环保的AI开发。

561 65
|
10月前
|
机器学习/深度学习 人工智能 算法
|

o3-mini:OpenAI 发布最新推理模型,强大的STEM推理能力,灵活调整推理强度

OpenAI o3-mini是OpenAI推出的全新推理模型,专为科学、数学和编程等技术领域优化,支持三种推理强度,灵活调整性能。

641 25
来自: 自然语言处理  版块
|
11月前
|
人工智能 自然语言处理 算法
|

OpenCSG开源最大中文合成数据集Chinese Cosmopedia

近年来,生成式语言模型(GLM)的飞速发展正在重塑人工智能领域,尤其是在自然语言处理、内容创作和智能客服等领域展现出巨大潜力。

290 15
|
11月前
|
JSON Devops 决策智能
|

muAgent v2.2版本发布,支持ekg-sdk使用

CodeFuse-muAgent 是一款创新的 Agent 框架,将知识图谱(KG)直接升级为 Agent 编排引擎。它基于大语言模型(LLM)和事理图谱(EKG),结合多智能体、工具学习等技术,通过拖拽式画布和轻量级文本编辑,实现复杂 SOP 流程的自动化。支持复杂推理、在线协同、人工交互和即时知识应用。该框架已在蚂蚁集团多个 DevOps 场景中成功落地。

350 1
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问Qwen征文活动获奖公布

Qwen征文获奖公布啦!

804 3
|
11月前
|
人工智能 自然语言处理 物联网
|

MultiBooth:清华联合 Meta 推出多对象的图像生成框架,生成包含多个指定对象的图像

MultiBooth是清华大学联合Meta等机构推出的多概念图像生成方法,支持高效生成高保真度图像,适用于娱乐、广告、教育等多个领域。

228 19
来自: 计算机视觉  版块
|
11月前
|
人工智能 物联网
|

如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台

如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台

282 10
|
11月前
|
机器学习/深度学习 人工智能 算法
|

RLCM:康奈尔大学推出文本到图像一致性模型优化框架,支持快速生成与任务特定奖励优化

RLCM 是康奈尔大学推出的基于强化学习的文本到图像生成模型优化框架,支持快速训练与推理,能够根据任务特定奖励函数生成高质量图像。

235 12
来自: 计算机视觉  版块
|
11月前
|
人工智能 开发框架 安全
|

Smolagents:三行代码就能开发 AI 智能体,Hugging Face 开源轻量级 Agent 构建库

Smolagents 是 Hugging Face 推出的轻量级开源库,旨在简化智能代理的构建过程,支持多种大语言模型集成和代码执行代理功能。

895 69
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能
|

Diff-Instruct:指导任意生成模型训练的通用框架,无需额外训练数据即可提升生成质量

Diff-Instruct 是一种从预训练扩散模型中迁移知识的通用框架,通过最小化积分Kullback-Leibler散度,指导其他生成模型的训练,提升生成性能。

317 11
来自: 计算机视觉  版块
|
12月前
|
机器学习/深度学习 自然语言处理 并行计算
|

社区供稿 | Para-Former:DUAT理论指导下的CV神经网络并行化,提速多层模型推理

神经网络正越来越多地朝着使用大数据训练大型模型的方向发展,这种解决方案在许多任务中展现出了卓越的性能。然而,这种方法也引入了一个迫切需要解决的问题:当前的深度学习模型基于串行计算,这意味着随着网络层数的增加,训练和推理时间也会随之增长。

246 28
|
12月前
|
数据采集 存储 自然语言处理
|

魔搭社区每周速递(12.22-12.28)

魔搭ModelScope本期社区进展:1039个模型,128个数据集,63个创新应用,6篇内容。

304 4
|
12月前
|
人工智能 自然语言处理 决策智能
|

DRT-o1:腾讯推出专注于文学翻译的 AI 模型,擅长理解比喻和隐喻等修辞手法,在翻译时保留原文的情感色彩

DRT-o1 是腾讯研究院推出的文学翻译系列 AI 模型,通过长链思考推理技术显著提升翻译质量,特别擅长处理比喻和隐喻等修辞手法。

425 2
来自: 自然语言处理  版块

刚刚参加了一个MCP赛事,奖金还可以,搭友们可以去试试看

社区8月比赛未获奖有点失落,但发现通义灵码×蚂蚁百宝箱MCP赛事正火热进行!参赛即有机会赢取丰厚奖金,激励满满,令人眼前一亮。已跃跃欲试,搭友们快来一起冲榜夺奖吧!https://tianchi.aliyun.com/competition/entrance/532442

228 2
|
1月前
|
人工智能 前端开发 关系型数据库
|

MajorRAG 概述(1/3)

一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法

132 1
来自: 自然语言处理  版块
|
2月前
|
人工智能 监控 Kubernetes
|

77_自动化脚本:Makefile与Airflow

在当今AI大模型时代,高效的工作流管理对于模型训练、推理和部署至关重要。随着大模型规模的不断增长和复杂度的提升,传统的手动脚本管理方式已无法满足需求。自动化脚本和工作流调度系统成为构建健壮、可重复、可扩展的LLM Pipeline的关键工具。其中,Makefile作为经典的自动化构建工具,与Airflow作为现代工作流调度平台的结合,为LLM开发团队提供了强大的工作流管理能力。

115 0
|
3月前
|
人工智能
|

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

225 8
|
3月前
|
存储 数据处理 数据库
|

公募REITs公告PDF文档处理项目

本项目是一个专门用于处理基础设施公募REITs(Real Estate Investment Trusts)公告PDF文件的完整RAG数据处理管道,也适用于其他公告PDF文件,应用多模态大模型,可高效提升文本提取内容。系统能够自动化地将PDF公告文档转换为结构化数据,能够检测表格、实现跨页表格拼接,并将表格内容还原为便于检索的文本信息。并构建向量数据库和 Elasticsearch 以支持智能检索与问答系统。

167 8
|
3月前
|
人工智能 关系型数据库 数据库
|

公募REITs专属AI多智能体查询分析项目

公募REITs专属AI多智能体查询分析项目。本项目是基于 OpenAI Agent 框架的多智能体项目,提供二级市场数据查询分析、招募说明书内容检索、公告信息检索、政策检索等多板块查询服务。支持图标绘制、文件生成。

158 2
|
4月前
|
人工智能 开发者
|

OpenVINO™ DevCon中国系列工作坊:AI模型优化与端侧应用落地

解锁AI高效部署新路径,共赴智能创新璀璨未来

145 1
|
4月前
|
人工智能 大数据 数据库
|

8月23日南京Unstructured Data Meetup 启动

8月23日,南京场Unstructured Data Meetup 将在阿里中心·南京建邺 江苏省南京市建邺区沙洲街道新城科技园科技创新综合体A2栋举办。

119 0
|
4月前
|
人工智能 机器人 测试技术
|

从支撑英伟达GR00T到登陆魔搭社区,智元AgiBot World打通具身智能全球数据生态

备受关注的 AgiBot World 百万真机数据集正式登陆国内顶级 AI开源社区——魔搭社区。该数据集由智元机器人开发,此前已在GitHub 和 Hugging Face 等国际平台开源并获得了业界的积极反响。此举是智元机器人布局国内AI生态的重要一步,国内开发者和研究者将能够更加顺畅地接入AgiBot World全套资源,降低数据获取和工具使用门槛,推动具身智能及机器人技术在国内的普及与发展。

167 0
|
5月前
|
存储 人工智能 调度
|

上海创智学院联合无问芯穹发布Megrez2.0,本征架构突破端模型不可能三角,以终端算力撬动云端智能

终端是实现数字智能和生命智能自由交互的重要接口,持续帮助人类拓展生产能力的边界。当下,终端智能面临着“能效-空间-智能”的不可能三角:以DeepSeek-R1为例,其参数规模高达6710亿,超出了大部分笔记本电脑的内存容量;即使勉强在一台笔记本电脑上成功运行满血版模型,理论上坚持不到9分钟就会耗尽电池;如果通过蒸馏,将满血版模型压缩到更小尺寸,此时的精度损失又可能满足不了智能水平的要求。

138 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

1
今日
14543
内容
6
活动
3820
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互