图像识别的搜索结果_文章_第8页-阿里云开发者社区

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

AgentSociety：告别纸上谈兵！AI社会模拟器预判政策漏洞：输入新规秒看30年后社会形态

AgentSociety 是清华大学推出的基于大语言模型的社会模拟器，通过构建类人心智的智能体模拟复杂社会行为，适用于政策沙盒测试、危机预警等场景。

# 图像识别 # 人工智能 # 分布式计算 # 监控 # 安全 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

HealthGPT：你的AI医疗助手上线了：支持X光到病理切片，诊断建议+报告生成全自动

HealthGPT 是浙江大学联合阿里巴巴等机构开发的先进医学视觉语言模型，具备医学图像分析、诊断辅助和个性化治疗方案建议等功能。

# 图像识别 # 存储 # 人工智能 # 搜索推荐 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分

Aider 是一款基于命令行的开源 AI 编程助手，支持多种编程语言和主流 LLM，可自动完成代码修改、Git 提交及语音交互。

# 图像识别 # 人工智能 # 自然语言处理 # JavaScript # 开发工具 # git

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

ToddlerBot：告别百万经费！6000刀就能造人形机器人，斯坦福开源全套方案普及机器人研究

ToddlerBot 是斯坦福大学推出的低成本开源人形机器人平台，支持强化学习、模仿学习和零样本模拟到现实转移，适用于运动操作研究和多场景应用。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 算法 # 数据可视化 # 机器人

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Magma：微软放大招！新型多模态AI能看懂视频+浏览网页+UI交互+控制机器人，数字世界到物理现实无缝衔接

Magma 是微软研究院开发的多模态AI基础模型，结合语言、空间和时间智能，能够处理图像、视频和文本等多模态输入，适用于UI导航、机器人操作和复杂任务规划。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 监控 # 机器人

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

CLaMP 3：音乐搜索AI革命！多模态AI能听懂乐谱/MIDI/音频，用27国语言搜索全球音乐

CLaMP 3是由清华大学团队开发的多模态、多语言音乐信息检索框架，支持27种语言，能够进行跨模态音乐检索、零样本分类和音乐推荐等任务。

# 图像识别 # XML # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 数据格式

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Omnitool：开发者桌面革命！开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台，本地运行不联网

Omnitool 是一款开源的 AI 桌面环境，支持本地运行，提供统一交互界面，快速接入 OpenAI、Stable Diffusion、Hugging Face 等主流 AI 平台，具备高度扩展性。

# 图像识别 # 人工智能 # Linux # API # 开发者 # Windows

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

VideoCaptioner：北大推出视频字幕处理神器，AI自动生成+断句+翻译，1小时工作量5分钟搞定

VideoCaptioner 是一款基于大语言模型的智能视频字幕处理工具，支持语音识别、字幕断句、优化、翻译全流程处理，并提供多种字幕样式和格式导出。

# 图像识别 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

PDF to Podcast：英伟达开源黑科技！PDF 秒转播客/有声书，告别阅读疲劳轻松学习！

NVIDIA推出的PDF to Podcast工具，基于大型语言模型和文本到语音技术，将PDF文档转换为生动的音频内容。

# 图像识别 # 存储 # 人工智能 # API # 语音技术 # 微服务

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Data Formulator：微软开源的数据可视化 AI 工具，通过自然语言交互快速创建复杂的数据图表

Data Formulator 是微软研究院推出的开源 AI 数据可视化工具，结合图形化界面和自然语言输入，帮助用户快速创建复杂的可视化图表。

# 自然语言处理 # 图像识别 # 人工智能 # 自然语言处理 # 数据可视化 # 前端开发 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别