图像识别的搜索结果_热门_第18页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

CogView4：智谱开源中文文生图新标杆，中文海报+任意分辨率一键生成

CogView4 是智谱推出的开源文生图模型，支持中英双语输入和任意分辨率图像生成，特别优化了中文文字生成能力，适合广告、创意设计等场景。

# 图像识别 # 编解码 # 人工智能 # 测试技术 # Apache # 算法框架/工具

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

SpatialLM：手机视频秒建3D场景！开源空间认知模型颠覆机器人训练

SpatialLM 是群核科技开源的空间理解多模态模型，能够通过普通手机拍摄的视频重建 3D 场景布局，赋予机器人类似人类的空间认知能力，适用于具身智能训练、自动导航、AR/VR 等领域。

# 图像识别 # 数据采集 # 人工智能 # 数据可视化 # 机器人 # vr&ar

德哥

|

博文

支付宝(AR虚拟现实)红包玩法与技术背景 - GIS(LBS)、图像识别与秒杀技术的完美结合

背景作为搞IT的小伙伴们，对虚拟现实（AR）应该并不陌生，这次支付宝带来了一个很有趣的功能，虚拟现实与藏红包结合起来。简单介绍一下这个业务，然后我们再来思考背后的技术。支付宝(AR虚拟现实)藏红包、找红包玩法介绍想象一下，你可以把你的红包藏在世界各地的任意角落，让全世界的人来找红包

# 图像识别 # 云原生数据库 PolarDB # 图像搜索 # 算法 # 关系型数据库 # 数据库 # PostgreSQL # 索引

泡沫o0

|

博文

Qt, OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合

# GPU云服务器 # 图像识别 # 机器学习/深度学习 # API # vr&ar # 计算机视觉 # 开发者

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Qwen2VL-Flux：开源的多模态图像生成模型，支持多种生成模式

Qwen2VL-Flux 是一个开源的多模态图像生成模型，结合了 Qwen2VL 的视觉语言理解和 FLUX 框架，能够基于文本提示和图像参考生成高质量的图像。该模型支持多种生成模式，包括变体生成、图像到图像转换、智能修复及 ControlNet 引导生成，具备深度估计和线条检测功能，提供灵活的注意力机制和高分辨率输出，是一站式的图像生成解决方案。

# 图像识别 # 机器学习/深度学习 # 人工智能

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Cosmos：英伟达生成式世界基础模型平台，加速自动驾驶与机器人开发

Cosmos 是英伟达推出的生成式世界基础模型平台，旨在加速物理人工智能系统的发展，特别是在自动驾驶和机器人领域。

# 图像识别 # 人工智能 # 自动驾驶 # 安全 # 机器人 # 开发者

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Baichuan-Omni-1.5：百川智能开源全模态理解与生成模型，支持文本、图像、音频和视频的多模态输入和输出

Baichuan-Omni-1.5 是百川智能开源的全模态理解模型，支持文本、图像、音频和视频的多模态输入和输出，显著提升多模态交互体验。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 数据库 # UED

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Ola：清华联合腾讯等推出的全模态语言模型！实现对文本、图像、视频和音频的全面理解

Ola 是由清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型，支持文本、图像、视频和音频输入，并具备实时流式解码功能。

# 图像识别 # 人工智能 # 测试技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Kiss3DGen：基于图像扩散模型的3D资产生成框架

Kiss3DGen是一个创新的3D资产生成框架，通过重新利用预训练的2D图像扩散模型，高效生成、编辑和增强3D对象，支持文本到3D、图像到3D等多种生成任务。

# 图像识别 # 人工智能 # 搜索推荐 # 开发者 # 异构计算

Deephub

|

博文

|

来自： ModelScope模型即服务

可以提高你的图像识别模型准确率的7个技巧

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 自然语言处理 # 算法 # 决策智能 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别