图像识别的搜索结果_第9页-阿里云开发者社区

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

ToddlerBot：告别百万经费！6000刀就能造人形机器人，斯坦福开源全套方案普及机器人研究

ToddlerBot 是斯坦福大学推出的低成本开源人形机器人平台，支持强化学习、模仿学习和零样本模拟到现实转移，适用于运动操作研究和多场景应用。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 算法 # 数据可视化 # 机器人

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Magma：微软放大招！新型多模态AI能看懂视频+浏览网页+UI交互+控制机器人，数字世界到物理现实无缝衔接

Magma 是微软研究院开发的多模态AI基础模型，结合语言、空间和时间智能，能够处理图像、视频和文本等多模态输入，适用于UI导航、机器人操作和复杂任务规划。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 监控 # 机器人

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

CLaMP 3：音乐搜索AI革命！多模态AI能听懂乐谱/MIDI/音频，用27国语言搜索全球音乐

CLaMP 3是由清华大学团队开发的多模态、多语言音乐信息检索框架，支持27种语言，能够进行跨模态音乐检索、零样本分类和音乐推荐等任务。

# 图像识别 # XML # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 数据格式

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Omnitool：开发者桌面革命！开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台，本地运行不联网

Omnitool 是一款开源的 AI 桌面环境，支持本地运行，提供统一交互界面，快速接入 OpenAI、Stable Diffusion、Hugging Face 等主流 AI 平台，具备高度扩展性。

# 图像识别 # 人工智能 # Linux # API # 开发者 # Windows

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

VideoCaptioner：北大推出视频字幕处理神器，AI自动生成+断句+翻译，1小时工作量5分钟搞定

VideoCaptioner 是一款基于大语言模型的智能视频字幕处理工具，支持语音识别、字幕断句、优化、翻译全流程处理，并提供多种字幕样式和格式导出。

# 图像识别 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

PDF to Podcast：英伟达开源黑科技！PDF 秒转播客/有声书，告别阅读疲劳轻松学习！

NVIDIA推出的PDF to Podcast工具，基于大型语言模型和文本到语音技术，将PDF文档转换为生动的音频内容。

# 图像识别 # 存储 # 人工智能 # API # 语音技术 # 微服务

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Data Formulator：微软开源的数据可视化 AI 工具，通过自然语言交互快速创建复杂的数据图表

Data Formulator 是微软研究院推出的开源 AI 数据可视化工具，结合图形化界面和自然语言输入，帮助用户快速创建复杂的可视化图表。

# 自然语言处理 # 图像识别 # 人工智能 # 自然语言处理 # 数据可视化 # 前端开发 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

InspireMusic：阿里通义实验室开源的音乐生成模型，支持文本或音频生成多种风格的音乐

阿里通义实验室开源的音乐生成技术，支持通过简单描述快速生成多种风格的高质量音乐作品。

# 图像识别 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 开发者

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Airweave：快速集成应用数据打造AI知识库的开源平台，支持多源整合和自动同步数据

Airweave 是一个开源工具，能够将应用程序的数据同步到图数据库和向量数据库中，实现智能代理检索。它支持无代码集成、多租户支持和自动同步等功能。

# 图数据库 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 图像识别 # 存储 # 人工智能 # NoSQL # API # 数据库

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

MedRAX：专注于胸部X光检查的AI医学推理智能体，帮助医生快速解读胸部X光片

MedRAX 是一款专门用于胸部X光检查的医学推理AI智能体，整合了多种最先进的分析工具，支持多模态推理和动态任务分解。

# 图像识别 # 人工智能 # 安全 # 数据挖掘 # 测试技术 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别