图像识别的搜索结果_热门_第16页-阿里云开发者社区

CodeLeader

|

博文

|

来自：视觉智能

基于ResNetRS的宝可梦图像识别

ResNetRS是在ResNet-D架构上面的改进

# 图像识别 # 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 数据可视化 # TensorFlow # 算法框架/工具

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

图文检索

图文检索简介

# 图像识别 # 搜索推荐 # 流计算 # 索引

上进小菜猪

|

博文

AIGC驱动智慧城市建设：智能图像应用的无限潜力

# 图像识别 # 监控 # 安全 # 搜索推荐 # 算法 # 调度 # 计算机视觉

路人贾jia

|

博文

经典神经网络论文超详细解读（二）——VGGNet学习笔记（翻译＋精读）

# GPU云服务器 # 图像识别 # 函数计算 # 机器学习/深度学习 # 编解码 # 算法框架/工具 # 计算机视觉 # 异构计算

以山向海

|

博文

图像识别与处理

# 图像识别 # 机器学习/深度学习 # 人工智能 # 编解码 # 算法 # 计算机视觉

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Kandinsky-3：开源的文本到图像生成框架，适应多种图像生成任务

Kandinsky-3 是一个开源的文本到图像生成框架，基于潜在扩散模型，能够适应多种图像生成任务。该框架支持高质量和逼真的图像合成，包括文本引导的修复/扩展、图像融合、文本-图像融合及视频生成等功能。Kandinsky-3 通过简化模型架构，提高了推理速度，同时保持了图像质量。

# 图像识别 # 人工智能 # 自然语言处理 # 网络性能优化 # 异构计算 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

LazyGraphRAG：微软推出的图形增强生成增强检索框架

LazyGraphRAG是微软研究院推出的图形增强生成增强检索框架，旨在大幅降低数据索引成本并提高查询效率。该框架结合了最佳优先搜索和广度优先搜索，支持本地和全局查询，适用于一次性查询、探索性分析和流数据处理。LazyGraphRAG将加入开源的GraphRAG库，为开发者和企业提供更高效的技术支持。

# 图像识别 # 人工智能 # 自然语言处理 # 数据处理 # 开发者 # 索引

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

StoryTeller：字节、上海交大、北大共同推出的全自动长视频描述生成一致系统

StoryTeller是由字节跳动、上海交通大学和北京大学共同推出的全自动长视频描述生成系统。该系统通过音频视觉角色识别技术，结合低级视觉概念和高级剧情信息，生成详细且连贯的视频描述。StoryTeller在MovieQA任务中展现出比现有模型更高的准确率，适用于电影制作、视频内容分析、辅助视障人士等多个应用场景。

# 图像识别 # 人工智能 # 算法 # 数据挖掘

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

DiffSensei：AI 漫画生成框架，能生成内容可控的黑白漫画面板，支持多角色和布局控制

DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架，能够生成可控的黑白漫画面板。该框架整合了基于扩散的图像生成器和多模态大型语言模型（MLLM），支持多角色控制和精确布局控制，适用于漫画创作、个性化内容生成等多个领域。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐 # 计算机视觉

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

VMB：中科院联合多所高校推出多模态音乐生成框架，能够通过文本、图像和视频等多种输入生成音乐

VMB（Visuals Music Bridge）是由中科院联合多所高校机构推出的多模态音乐生成框架，能够从文本、图像和视频等多种输入模态生成音乐。该框架通过文本桥接和音乐桥接解决了数据稀缺、跨模态对齐弱和可控性有限的问题。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 安全 # vr&ar

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别