图像识别的搜索结果_热门_第13页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

AgiBot World：智元机器人开源百万真机数据集，数据集涵盖了日常生活所需的绝大多数动作

AgiBot World 是智元机器人开源的百万真机数据集，旨在推动具身智能的发展，覆盖家居、餐饮、工业等五大核心场景。

# 图像识别 # 数据采集 # 传感器 # 人工智能 # 机器人

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

开源学习神器把2小时网课压成5分钟脑图！BiliNote：一键转录哔哩哔哩视频，生成结构化学习文档

本文介绍基于FastAPI与React构建的开源视频笔记工具BiliNote，其整合多模态AI技术实现视频内容结构化解析，支持跨平台视频源处理与本地化部署方案，提供从语音转写到智能摘要的全流程自动化能力。

# 图像识别 # 人工智能 # 前端开发 # 语音技术 # Docker # 容器

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度，解决视频生成中的"遗忘"和"漂移"问题，仅需6GB显存即可在普通笔记本上实时生成高清视频。

# GPU云服务器 # 图像识别 # 人工智能 # 并行计算 # Linux # 调度 # 异构计算

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

MEMO：通过音频和图像生成肖像说话视频，感知音频中的情感来细化面部表情

MEMO是一种音频驱动的生成肖像说话视频框架，由Skywork AI、南洋理工大学和新加坡国立大学联合推出。该框架通过记忆引导的时间模块和情感感知音频模块，确保生成的视频在身份一致性和表现力方面达到高水平。MEMO支持多种图像风格和音频类型的说话视频生成，并能处理多语言输入。

# 图像识别 # 机器学习/深度学习 # 存储 # 数据采集 # 人工智能 # 自然语言处理

我叫小米粒

|

13天前

|

博文

|

来自： ModelScope模型即服务

企业AI中台为什么要把AI工作助理放在第一优先级！

因为员工真正接触到的不是架构图，而是入口；组织真正积累下来的也不是功能清单，而是入口背后的使用数据、路由逻辑、能力目录和持续反馈。这些东西，才决定平台能不能从技术项目变成组织能力。

# 图像识别 # 人工智能

fundroid

|

博文

【代码吸猫】使用 Google MLKit 进行图像识别

# 图像识别 # 人工智能 # 前端开发 # API # Android开发 # 计算机视觉

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Agent-E：基于 AutoGen 代理框架构建的 AI 浏览器自动化系统

Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统，专注于浏览器内的自动化操作。它能够执行多种复杂任务，如填写表单、搜索和排序电商产品、定位网页内容等，从而提高在线效率，减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。

# 图像识别 # 自然语言处理 # 人工智能 # 自然语言处理 # JavaScript # iOS开发 # MacOS

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Trae 接入 Claude 3.7：AI 编程工具界的“卷王”，完全免费使用！

Trae 是一款完全免费的AI编程工具，现已接入 Claude 3.7 模型，提供代码生成、调试等强大功能，支持多模态输入和上下文理解，用户可享受24小时高速服务，无需担心付费限制。Trae 支持多平台，安装简便，适合开发者快速上手。

# 图像识别 # 人工智能 # 自然语言处理 # IDE # 开发工具 # C++

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

StarVector：图像秒变矢量代码！开源多模态模型让SVG生成告别手绘

StarVector是由ServiceNow Research等机构联合开发的开源多模态视觉语言模型，能够将图像和文本转换为可编辑的SVG矢量图形，支持1B和8B两种规模，在SVG生成任务中表现出色。

# 图像识别 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

AutoGLM沉思是由智谱AI推出的一款开创性AI智能体，它突破性地将深度研究能力与实际操作能力融为一体，实现了AI从被动响应到主动执行的跨越式发展。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 搜索推荐 # 数据可视化

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别