|
10月前
|
机器学习/深度学习 人工智能 算法
|

RLCM:康奈尔大学推出文本到图像一致性模型优化框架,支持快速生成与任务特定奖励优化

RLCM 是康奈尔大学推出的基于强化学习的文本到图像生成模型优化框架,支持快速训练与推理,能够根据任务特定奖励函数生成高质量图像。

181 12
来自: 计算机视觉  版块
|
11月前
|
机器学习/深度学习 自然语言处理 并行计算
|

社区供稿 | Para-Former:DUAT理论指导下的CV神经网络并行化,提速多层模型推理

神经网络正越来越多地朝着使用大数据训练大型模型的方向发展,这种解决方案在许多任务中展现出了卓越的性能。然而,这种方法也引入了一个迫切需要解决的问题:当前的深度学习模型基于串行计算,这意味着随着网络层数的增加,训练和推理时间也会随之增长。

204 28
|
11月前
|
机器学习/深度学习 人工智能
|

DiTCtrl:腾讯推出多提示视频生成方法,通过多个提示生成连贯的视频内容,确保内容与提示一致

DiTCtrl 是一种基于多模态扩散变换器(MM-DiT)架构的多提示视频生成方法,能够在无需额外训练的情况下,实现多个文本提示之间的连贯视频生成,并保持内容和运动的一致性。

173 1
来自: 计算机视觉  版块
|
11月前
|

MNN推理框架将大模型放进移动端设备,并达到SOTA推理性能!

MNN推理框架将大模型放进移动端设备,并达到SOTA推理性能!

422 0
|
11月前
|
人工智能 自然语言处理 PyTorch
|

Bamba-9B:基于 Mamba2 架构的仅解码语言模型,旨在提高大型语言模型在推理时的效率

Bamba-9B 是由 IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的基于 Mamba2 架构的仅解码语言模型。该模型在开放数据集上训练,旨在提高大型语言模型的推理效率,特别是在处理长文本时的内存带宽瓶颈。Bamba-9B 在推理时相较于标准变换器模型展现出 2.5 倍的吞吐量提升和 2 倍的延迟加速。

227 12
来自: 自然语言处理  版块
|
11月前
|

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

184 1
|
11月前
|
人工智能 自然语言处理 物联网
|

AI Safeguard联合 CMU,斯坦福提出端侧多模态小模型

随着人工智能的快速发展,多模态大模型(MLLMs)在计算机视觉、自然语言处理和多模态任务中扮演着重要角色。

225 0
|
11月前
|
存储 人工智能 数据库
|

Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目

Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。

291 11
来自: 自然语言处理  版块
|
12月前
|
人工智能 机器人 信息无障碍
|

11月30日“2024 AI+硬件创新大赛”决赛-杭州西湖体育馆见!

探索AI硬件创新,28强团队决战杭州西湖体育馆

229 1
|
12月前
|
Java
|

java 中 IO 流

Java中的IO流是用于处理输入输出操作的机制,主要包括字节流和字符流两大类。字节流以8位字节为单位处理数据,如FileInputStream和FileOutputStream;字符流以16位Unicode字符为单位,如FileReader和FileWriter。这些流提供了读写文件、网络传输等基本功能。

204 10

图片修复

该技术在图片重新上色和色彩增强方面表现突出,图像去噪效果也很好。如果能加入人像增强功能以提升清晰度,将更加完美。

246 0
来自: 计算机视觉  版块
|
5月前
|
机器学习/深度学习 自然语言处理 测试技术
|

魔搭社区模型速递(5.25-6.1)

魔搭ModelScope本期社区进展:📟1636个模型,📁663个数据集,🎨147个创新应用,📄 6 篇内容

194 0
|
3月前
|
人工智能 数据可视化 决策智能
|

京东零售重磅开源 | OxyGent:像搭乐高一样组装AI团队,实现群体智能

京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统,实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。

210 0
|
3月前
|
XML 机器学习/深度学习 人工智能
|

利用OpenVINO™ 快速部署端侧可用的MiniCPM-V4.0视觉大模型

MiniCPM-V4.0是MiniCPM-V系列中最新的高效模型,参数总量为4B。该模型在 OpenCompass评测中图像理解能力超越了GPT-4.1-mini-20250414、Qwen2.5-VL-3B-Instruct和InternVL2.5-8B。凭借小巧的参数规模和高效的架构,MiniCPM-V4.0是移动端部署的理想选择。

135 0
|
2月前
|
云栖大会
|

一图全览魔搭社区@2025云栖大会安排

一图全览魔搭社区@2025云栖大会安排

141 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14398
内容
6
活动
3679
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互