|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

360Zhinao2-7B:360推出自研360智脑大模型的升级版

360Zhinao2-7B是360自研的AI大模型360智脑7B参数升级版,涵盖基础模型及多种上下文长度的聊天模型。该模型在语言理解与生成、聊天能力、数学逻辑推理等方面表现出色,支持多语言和多上下文长度,适用于多种商业应用场景。

347 23
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

GLM-Edge:智谱开源的端侧大语言和多模态系列模型

GLM-Edge是智谱开源的一系列端侧部署优化的大语言对话模型和多模态理解模型,旨在实现模型性能、实机推理效果和落地便利性之间的最佳平衡。该系列模型支持在手机、车机和PC等端侧设备上高效运行,适用于智能助手、聊天机器人、图像标注等多种应用场景。

326 7
来自: 多模态  版块
|
11月前
|
人工智能 自然语言处理
|

Promptriever:信息检索模型,支持自然语言提示响应用户搜索需求

Promptriever 是一种新型信息检索模型,由约翰斯·霍普金斯大学和 Samaya AI 联合推出。该模型能够接受自然语言提示,并以直观的方式响应用户的搜索需求。通过在 MS MARCO 数据集上的训练,Promptriever 在标准检索任务上表现出色,能够更有效地遵循详细指令,提高查询的鲁棒性和检索性能。

208 6
来自: 自然语言处理  版块
|
11月前
|
人工智能 JSON 数据管理
|

ShowUI:新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

ShowUI是由新加坡国立大学Show Lab和微软联合推出的视觉-语言-行动模型,旨在提升图形用户界面(GUI)助手的效率。该模型通过UI引导的视觉令牌选择和交错视觉-语言-行动流,有效减少计算成本并提高训练效率。ShowUI在小规模高质量数据集上表现出色,展现出在GUI自动化领域的潜力。

337 4
来自: 多模态  版块
|
12月前
|
人工智能 API
|

EvolveDirector:阿里联合南洋理工推出文本到图像生成模型的高效训练技术

EvolveDirector是由阿里巴巴和南洋理工大学联合推出的文本到图像生成模型的高效训练技术。该框架通过与高级模型的API交互获取数据对,并利用预训练的大型视觉语言模型(VLMs)动态优化训练数据集,显著减少了数据量和训练成本。EvolveDirector能够从多个高级模型中选择最佳样本进行学习,使最终训练出的模型在多个方面超越现有高级模型。

220 0
来自: 多模态  版块
|
12月前
|
人工智能 机器人 信息无障碍
|

11月30日“2024 AI+硬件创新大赛”决赛-杭州西湖体育馆见!

探索AI硬件创新,28强团队决战杭州西湖体育馆

232 1
|
12月前
|
机器学习/深度学习 数据采集 人工智能
|

TÜLU 3:Ai2推出的系列开源指令遵循模型

TÜLU 3是由艾伦人工智能研究所(Ai2)推出的开源指令遵循模型系列,包括8B和70B两个版本,未来计划推出405B版本。该模型在性能上超越了Llama 3.1 Instruct版本,提供了详细的后训练技术报告,公开数据、评估代码和训练算法。TÜLU 3基于强化学习、直接偏好优化等先进技术,显著提升模型在数学、编程和指令遵循等核心技能上的表现。

346 4
来自: 自然语言处理  版块
|
12月前
|
人工智能 自然语言处理 开发工具
|

Pangea:卡内基梅隆大学开源的多语言多模态大语言模型

Pangea是由卡内基梅隆大学团队开发的多语言多模态大型语言模型,支持39种语言,包含高质量英文指令、机器翻译指令及文化相关任务。该模型在多语言和文化背景下的性能超越现有开源模型,适用于多语言客户服务、教育和学习、跨文化交流等多个应用场景。

286 2
来自: 多模态  版块
|
12月前
|
人工智能 编解码 搜索推荐
|

OneDiffusion:无缝支持双向图像合成和理解的开源扩散模型

OneDiffusion 是一个开源的扩散模型,能够无缝支持双向图像合成和理解。它基于统一的训练框架,支持多种任务,如文本到图像生成、条件图像生成和图像理解等。OneDiffusion 通过流匹配框架和序列建模技术,实现了高度的灵活性和可扩展性。

215 2
来自: 计算机视觉  版块
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据

Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。

425 8
来自: 多模态  版块
|
12月前
|
物联网 Swift Python
|

基于qwen模型实现大模型应用探索-党务知识小助手

本项目基于qwen2-7b-instruct模型,采用LoRA技术,在党务知识数据集与通用数据集上进行微调,专为党务领域问答设计,涵盖党员教育等场景。通过数据准备、模型微调、推理测试及部署应用。

472 0
|
12月前
|
数据库 SQL Python
|

基于SQL数据库的RAG的若干疑问

153 1
来自:自然语言处理 版块
|
12月前
|
机器学习/深度学习 算法
|

魔搭案例开源获奖

赵卫东老师在第七届CCF开源创新大赛教学案例赛道中荣获特等奖。他的案例设计注重理论与实践结合,采用阿里魔搭平台和英特尔OpenVINO等先进技术,提升课程的实用性与前瞻性。该案例已开源,并在教学中取得显著成效。赵卫东老师一直坚持“学以致用、产教融合”的理念,多次在教学比赛中获奖。

365 7

图片修复

该技术在图片重新上色和色彩增强方面表现突出,图像去噪效果也很好。如果能加入人像增强功能以提升清晰度,将更加完美。

249 0
来自: 计算机视觉  版块
|
2月前
|
监控 Devops 持续交付
|

从 DevOps 文化到以平台为中心的交付

DevOps 工程师与平台工程师在软件交付中各司其职。DevOps 强调开发与运维协作,推动自动化与文化变革;平台工程则聚焦构建自助式内部开发者平台,提升开发效率与一致性。两者相辅相成,共同加速高质量软件交付。

179 1
|
3月前
|
人工智能
|

AI界的篮球赛AI-BA来了,NBA中国赛2025比赛门票等你来拿

AI界的篮球赛AI-BA来了,NBA中国赛2025比赛门票等你来拿

130 9
|
3月前
|
人工智能
|

【千问海报大赛·地方风物】创意征集令!用AI解锁家乡新名片,万元奖金等你来战!

用Qwen-Image打破常规!将家乡的地标、方言、美食或热梗,通过错位混搭(赛博山水×古风建筑?霓虹城市×传统小吃?)或风格化创作(复古卡通、漫画方言…)焕发全新视觉冲击力!

163 10
|
4月前
|
SQL XML 缓存
|

控制接口RT暴降80%!CompletableFuture异步编排实战代码模板

Springboot 控制接口RT暴降80%!CompletableFuture异步编排实战代码模板

113 0
|
4月前
|
云安全 人工智能 安全
|

2025·全球AI攻防挑战赛启动选手招募:图、视、音三赛道逐鹿,推动AI安全技术进化

7月10日,2025·全球AI攻防挑战赛正式启动选手招募,邀请国内外的AI安全攻防精英参与全模态的AI攻防实战演练。本次大赛将重点关注数字身份交互认证安全,特别是在生活、金融和健康等场景下的应用。比赛分为图片、视频和音频三个赛道,采用攻防闭环的赛程设计,打破传统的静态攻防模式,推动安全技术的持续进化和发展。

158 0
|
4月前
|

送福利!FlowBench客户端首批内测邀请函

魔搭AIGC搭子们,集合啦!ModelScope x FlowBench 团队

159 3
|
7月前
|
人工智能 编解码
|

导演失业预警!Seaweed-7B:字节7B参数模型让剧本自动变电影!20秒长镜头丝滑生成

Seaweed-7B是字节跳动推出的70亿参数视频生成模型,支持从文本、图像或音频生成高质量视频内容,具备长镜头生成、实时渲染等先进特性,通过优化架构显著降低计算成本。

288 10
来自: 多模态  版块
|
8月前
|
人工智能 缓存 自然语言处理
|

TokenSwift:90分钟生成10万Token!文本生成提速3倍,无损加速黑科技

TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,速度提升3倍,生成质量无损,支持多种模型架构。

235 16
来自: 自然语言处理  版块
|
8月前
|
人工智能
|

MV-MATH:中科院开源多模态数学推理基准,多视觉场景评估新标杆

MV-MATH 是中科院自动化所推出的多模态数学推理基准数据集,旨在评估多模态大语言模型在多视觉场景中的数学推理能力。该数据集包含2009个高质量的数学问题,涵盖11个数学领域和3个难度级别,适用于智能辅导系统和多模态学习研究。

168 0
来自: 多模态  版块
|
8月前
|

有偿创建 CosyVoice2-0.5B 大模型

有偿创建 CosyVoice2-0.5B 大模型,希望有人能帮忙在创空间 创建一个这样的模型,官方的老出502

465 22
|
8月前
|
人工智能 自然语言处理 自动驾驶
|

AVD2:清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2 是由清华大学联合多所高校推出的自动驾驶事故视频理解与生成框架,结合视频生成与事故分析,生成高质量的事故描述、原因分析和预防措施,显著提升自动驾驶系统的安全性和可靠性。

146 6
来自: 计算机视觉  版块
|
8月前
|
机器学习/深度学习 人工智能 缓存
|

SepLLM:开源大模型加速神器!400万Token长文本推理提速50%,告别OOM噩梦

SepLLM 是一个用于加速大语言模型的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率,适用于长文本处理和多场景部署。

229 7
来自: 自然语言处理  版块
|
9月前
|
存储 算法 测试技术
|

CodeFuse-AAIS:改进低智能体框架助力高效程序修复

本文提出了一种基于低智能体框架的自适应自动化程序修复(APR)解决方案——AAIS。该方案结合了智能体的自适应性和低智能体的高效控制流,通过引入交互式缺陷定位和多模型辅助生成,显著提升了程序修复的准确性和多样性。实验结果表明,AAIS在SWE-Bench基准测试中表现出色,函数级定位准确率提升了46.94%-113.32%,Issue Solving任务上达到了35.67%的性能,展示了其在未来软件开发中的应用潜力。

211 0
|
9月前
|
机器学习/深度学习 存储 人工智能
|

Satori:快速体验MIT与哈佛推出7B参数的推理专家模型,具备自回归搜索和自我纠错能力

Satori 是由 MIT 和哈佛大学等机构联合推出的 7B 参数大型语言模型,专注于提升推理能力,具备强大的自回归搜索和自我纠错功能。

180 5
来自: 自然语言处理  版块
|
9月前
|
人工智能 测试技术
|

VARGPT:将视觉理解与生成统一在一个模型中,北大推出支持混合模态输入与输出的多模态统一模型

VARGPT是北京大学推出的多模态大语言模型,专注于视觉理解和生成任务,支持混合模态输入和高质量图像生成。

240 22
来自: 多模态  版块
|
10月前
|
人工智能 计算机视觉 开发者
|

SmartEraser:中科大推出图像对象移除技术,轻松移除照片中的不想要元素,保留完美瞬间

SmartEraser 是由中科大与微软亚洲研究院联合开发的图像编辑技术,能够精准移除图像中的指定对象,同时保留周围环境的细节和结构,适用于复杂场景的图像处理。

237 8
来自: 计算机视觉  版块
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问Qwen征文活动获奖公布

Qwen征文获奖公布啦!

741 3
|
10月前
|
机器学习/深度学习 人工智能 算法
|

Edicho:多图像一致性编辑,支持即插即用无需训练,快速实现风格转换

Edicho 是蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法,基于扩散模型,支持即插即用,无需额外训练,适用于多种图像编辑任务。

208 8
来自: 计算机视觉  版块
|
10月前
|
人工智能 自然语言处理 并行计算
|

VITRON:开源像素级视觉大模型,同时满足图像与视频理解、生成、分割和编辑等视觉任务

VITRON 是由 Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大模型,支持图像与视频的理解、生成、分割和编辑,适用于多种视觉任务。

597 13
来自: 计算机视觉  版块
|
10月前
|
人工智能 搜索推荐 网络架构
|

TryOffAnyone:快速将模特服装图还原为平铺商品图,生成标准化的服装展示效果

TryOffAnyone 是一款基于 AI 技术的工具,能够将模特穿着服装的图像快速还原为平铺商品图,支持智能识别、自动优化等功能,适用于电商平台和虚拟试衣场景。

497 12
来自: 计算机视觉  版块
|
11月前
|
Linux API 开发工具
|

魔搭llamafile集成:让大模型开箱即用

Llamafile是一个将大模型和其所需运行环境,全封装在一个可执行文件中的开源创新项目。为了方便广大开发者能以更低的门槛使用大模型,魔搭社区上提供了大量优秀模型的llamafile格式。

338 5
|
11月前
|
数据采集 人工智能 分布式计算
|

探索云端数据力量:MaxFrame的革命性实践

MaxFrame是阿里云自研的分布式计算框架,专为Python开发者设计,支持大规模数据处理和AI模型开发。本文介绍MaxFrame方案,评测其在分布式Pandas处理、大语言模型数据处理中的表现,分析产品开通使用步骤及功能满足度,并提出改进建议。对比其他工具,MaxFrame易用性高、性能优,但在功能丰富度上仍有提升空间。总结指出MaxFrame潜力巨大,未来有望更加完善。

218 24

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14405
内容
6
活动
3695
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互