图像识别的搜索结果_热门_第8页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型，具备强大的图像识别、OCR文字识别和数据提取能力，支持API调用，适用于多种应用场景。

# 文字识别 # 图像识别 # 人工智能 # 文字识别 # API # Python

Kevosky

|

6月前

|

博文

|

来自： ModelScope模型即服务

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

Doo AI是一款简洁易用的开源AI模型本地部署工具，支持通义千问3/VL、LLaMA3.1等主流HF格式模型。下载即用，扫描→点击“加载”，可以快速、轻松完成部署；纯本地运行，隐私安全；支持文本对话、图像识别、RAG、角色提示词等实用功能。（239字）

# 图像识别 # 存储 # 人工智能 # 安全 # 前端开发 # API

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

StockMixer：上海交大推出预测股票价格的 MLP 架构，通过捕捉指标、时间和股票间的复杂相关性，预测下一个交易日的收盘价

StockMixer 是上海交通大学推出的基于多层感知器的股票价格预测架构，通过指标、时间和股票混合实现高效预测。

# 图像识别 # 人工智能 # 算法 # 测试技术 # 决策智能 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Hunyuan3D 2.0：腾讯混元开源3D生成大模型！图生/文生秒建高精度模型，细节纹理自动合成

Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统，专注于从文本和图像生成高分辨率的 3D 模型，支持几何生成和纹理合成。

# 图像识别 # 人工智能 # PyTorch # API # 算法框架/工具 # 图形学

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

WeaveFox：蚂蚁集团推出 AI 前端智能研发平台，能够根据设计图直接生成源代码，支持多种客户端和技术栈

蚂蚁团队推出的AI前端研发平台WeaveFox，能够根据设计图直接生成前端源代码，支持多种应用类型和技术栈，提升开发效率和质量。本文将详细介绍WeaveFox的功能、技术原理及应用场景。

# 图像识别 # 人工智能 # 移动开发 # 前端开发 # JavaScript # 小程序

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

用自然语言控制电脑，字节跳动开源 UI-TARS 的桌面版应用！内附详细的安装和配置教程

UI-TARS Desktop 是一款基于视觉语言模型的 GUI 代理应用，支持通过自然语言控制电脑操作，提供跨平台支持、实时反馈和精准的鼠标键盘控制。

# 自然语言处理 # 图像识别 # 人工智能 # 自然语言处理 # API # iOS开发 # MacOS

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型，基于DiT架构和高效视频压缩VAE，能够根据首尾帧图像自动生成5秒720p高清视频，支持多种风格变换和细节复刻。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # Apache # 异构计算

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Doubao-1.5-pro：字节跳动最新豆包大模型，性能超越GPT-4o和Claude 3.5 Sonnet

豆包大模型1.5是字节跳动推出的最新大模型，采用大规模稀疏MoE架构，支持多模态输入输出，具备低时延语音对话能力，综合性能优于GPT-4o和Claude 3.5 Sonnet。

# 图像识别 # 人工智能 # 编解码 # 算法 # 异构计算

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Agno：18.7K Star！快速构建多模态智能体的轻量级框架，运行速度比LangGraph快5000倍！

Agno 是一个用于构建多模态智能体的轻量级框架，支持文本、图像、音频和视频等多种数据模态，能够快速创建智能体并实现高效协作。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 图像识别 # 存储 # 人工智能 # 数据库 # 决策智能 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Janus-Pro：DeepSeek 开源的多模态模型，支持图像理解和生成

Janus-Pro是DeepSeek推出的一款开源多模态AI模型，支持图像理解和生成，提供1B和7B两种规模，适配多元应用场景。通过改进的训练策略、扩展的数据集和更大规模的模型，显著提升了文本到图像的生成能力和指令跟随性能。

# 图像识别 # 人工智能 # 自然语言处理 # 计算机视觉 # 开发者 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别