图像识别的搜索结果_热门_第9页-阿里云开发者社区

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

LLaVA-Med：微软推出专为临床放射学优化和报告生成的多模态模型

LLaVA-Med是微软推出的小型多模态模型，专注于高效生成高质量的胸部X光放射学报告，支持快速临床部署。

# 图像识别 # 人工智能 # 计算机视觉 # 异构计算

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Flame：开源AI设计图转代码模型！生成React组件，精准还原UI+动态交互效果

Flame 是一款开源的多模态 AI 模型，能够将 UI 设计图转换为高质量的现代前端代码，支持 React 等主流框架，具备动态交互、组件化开发等功能，显著提升前端开发效率。

# 图像识别 # 人工智能 # 自然语言处理 # 前端开发 # JavaScript # API

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Emotion-LLaMA：用 AI 读懂、听懂、看懂情绪，精准捕捉文本、音频和视频中的复杂情绪

Emotion-LLaMA 是一款多模态情绪识别与推理模型，融合音频、视觉和文本输入，通过特定情绪编码器整合信息，广泛应用于人机交互、教育、心理健康等领域。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 人机交互

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

VideoCaptioner：北大推出视频字幕处理神器，AI自动生成+断句+翻译，1小时工作量5分钟搞定

VideoCaptioner 是一款基于大语言模型的智能视频字幕处理工具，支持语音识别、字幕断句、优化、翻译全流程处理，并提供多种字幕样式和格式导出。

# 图像识别 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

SongGen：三秒克隆音色！开源AI一键生成专业级歌曲，创作人必备神器

SongGen是由上海AI Lab、北京航空航天大学和香港中文大学联合推出的单阶段自回归Transformer模型，能够通过文本生成高质量歌曲，支持混合模式和双轨模式，显著提升生成歌曲的自然度和人声清晰度。

# 图像识别 # 数据采集 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

阿里通义开源全模态大语言模型 R1-Omni：情感分析成绩新标杆！推理过程全程透明，准确率飙升200%

R1-Omni 是阿里通义开源的全模态大语言模型，专注于情感识别任务，结合视觉和音频信息，提供可解释的推理过程，显著提升情感识别的准确性和泛化能力。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 监控 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

QVQ-Max：阿里通义新一代视觉推理模型！再造多模态「全能眼」秒解图文难题

QVQ-Max是阿里通义推出的新一代视觉推理模型，不仅能解析图像视频内容，还能进行深度推理和创意生成，在数学解题、数据分析、穿搭建议等场景展现强大能力。

# 图像识别 # 人工智能 # 数据可视化 # 数据挖掘 # 计算机视觉

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

StockMixer：上海交大推出预测股票价格的 MLP 架构，通过捕捉指标、时间和股票间的复杂相关性，预测下一个交易日的收盘价

StockMixer 是上海交通大学推出的基于多层感知器的股票价格预测架构，通过指标、时间和股票混合实现高效预测。

# 图像识别 # 人工智能 # 算法 # 测试技术 # 决策智能 # Python

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

MoneyPrinterTurbo：23.9K Star！这个AI把写文案+找素材+剪视频全包了，日更10条不是梦

MoneyPrinterTurbo 是一款功能强大的 AI 工具，支持通过主题或关键词自动生成视频文案、素材、字幕与背景音乐，并合成高清短视频，适合批量生成与多语言支持。

# 图像识别 # 人工智能 # 前端开发 # API # 语音技术 # Windows

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

傅利叶开源人形机器人，提供完整的开源套件！Fourier N1：具备23个自由度和3.5米/秒运动能力

傅利叶推出的开源人形机器人N1搭载自研动力系统与多模态交互模块，具备23个自由度和3.5米/秒运动能力，提供完整开源套件助力开发者验证算法。

# 图像识别 # 传感器 # 人工智能 # 算法 # 机器人 # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别