图像识别的搜索结果_热门_第19页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Valley：字节跳动开源小体积的多模态模型，在小于 10B 参数的模型中排名第二

Valley 是字节跳动推出的多模态大模型，能够处理文本、图像和视频数据，在电子商务和短视频领域表现优异，并在 OpenCompass 测试中排名第二。

# 图像识别 # 人工智能 # 测试技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

StockMixer：上海交大推出预测股票价格的 MLP 架构，通过捕捉指标、时间和股票间的复杂相关性，预测下一个交易日的收盘价

StockMixer 是上海交通大学推出的基于多层感知器的股票价格预测架构，通过指标、时间和股票混合实现高效预测。

# 图像识别 # 人工智能 # 算法 # 测试技术 # 决策智能 # Python

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

OpenEMMA：德克萨斯开源端到端的自动驾驶多模态模型框架，基于预训练的 MLLMs，处理复杂的视觉数据，推理驾驶场景

OpenEMMA 是德州农工大学、密歇根大学和多伦多大学共同开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型处理视觉数据和复杂驾驶场景的推理。

# 图像识别 # 传感器 # 人工智能 # 自动驾驶 # API # 数据处理

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

VideoLLaMA3：阿里达摩院开源专注于视觉理解的多模态基础模型，具备多语言视频理解能力

VideoLLaMA3 是阿里巴巴开源的多模态基础模型，专注于图像和视频理解，支持多语言生成、视频内容分析和视觉问答任务，适用于多种应用场景。

# 图像识别 # 自然语言处理 # 人工智能 # 自然语言处理 # 达摩院 # 并行计算 # PyTorch

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Baichuan-Omni-1.5：百川智能开源全模态理解与生成模型，支持文本、图像、音频和视频的多模态输入和输出

Baichuan-Omni-1.5 是百川智能开源的全模态理解模型，支持文本、图像、音频和视频的多模态输入和输出，显著提升多模态交互体验。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 数据库 # UED

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

结合DeepSeek-R1强化学习方法的视觉模型！VLM-R1：输入描述就能精确定位图像目标

VLM-R1 是基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像目标，支持复杂场景推理与高效训练。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 开发者

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

AppAgentX：告别重复点击！自我进化式GUI代理自动生成高级操作，效率翻倍

AppAgentX 是西湖大学推出的新型自我进化式 GUI 代理框架，通过记忆和进化机制提升智能手机交互的效率和智能性，支持复杂任务和跨应用操作，显著优于现有方法。

# 图像识别 # 存储 # 人工智能 # API # Android开发 # 容器

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

从商业海报到二次元插画多风格通吃！HiDream-I1：智象未来开源文生图模型，17亿参数秒出艺术大作

HiDream-I1是智象未来团队推出的开源图像生成模型，采用扩散模型技术和混合专家架构，在图像质量、提示词遵循能力等方面表现优异，支持多种风格生成。

# 图像识别 # 人工智能 # 并行计算 # 测试技术 # 网络架构 # 内存技术

云攻略小攻

|

博文

阿里云视觉智能开放平台正式上线，阿里集团核心视觉AI能力对外开放

# 视觉智能开放平台 # 图像识别 # 文字识别 # 机器学习/深度学习 # 新零售 # 人工智能 # 文字识别 # 运维 # 安全 # 图计算 # 计算机视觉 # 开发者 # 黑灰产治理

城市大脑生态运营

|

博文

阿里云AI | 畜牧养殖业综合解决方案

本文介绍了阿里云AI | 畜牧养殖业综合解决方案的方案概述以及业务价值。

# 图像识别 # 传感器 # 人工智能 # 城市大脑 # 监控 # 算法 # 安全 # 物联网 # 大数据 # 定位技术 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别