带你读小助手

|

文字识别算法计算机视觉

关键帧提取 | 学习笔记

快速学习关键帧提取，介绍了关键帧提取系统机制，以及在实际应用过程中如何使用。

带你读小助手

3914 0 0

小白玩转python

|

存储人工智能测试技术

图像相似度比较之 CLIP or DINOv2

小白玩转python

1994 0 0

宋wz

|

数据可视化

ShapeNet数据集及dataset代码分析

宋wz

1995 0 0

一个处女座的程序猿

|

算法数据库计算机视觉

Dataset之COCO数据集：COCO数据集的简介、下载、使用方法之详细攻略

一个处女座的程序猿

39272 1 1

云栈开源日记

|

5月前

|

机器学习/深度学习人工智能前端开发

终端里的 AI 编程助手：OpenCode 使用指南

OpenCode 是开源的终端 AI 编码助手，支持 Claude、GPT-4 等模型，可在命令行完成代码编写、Bug 修复、项目重构。提供原生终端界面和上下文感知能力，适合全栈开发者和终端用户使用。

云栈开源日记

43856 11 14

Deephub

|

机器学习/深度学习人工智能数据可视化

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

本文系统对比了扩散模型与Flow Matching两种生成模型技术。扩散模型通过逐步添加噪声再逆转过程生成数据，类比为沙堡的侵蚀与重建；Flow Matching构建分布间连续路径的速度场，如同矢量导航系统。两者在数学原理、训练动态及应用上各有优劣：扩散模型适合复杂数据，Flow Matching采样效率更高。文章结合实例解析两者的差异与联系，并探讨其在图像、音频等领域的实际应用，为生成建模提供了全面视角。

Deephub

2671 1 1

bailiantest1

|

11月前

|

测试技术 UED

全新开源通义千问Qwen3，它来了！

Qwen3是通义千问系列的最新模型，融合推理与非推理模式，兼具QwQ和Instruct模型能力。提供多种尺寸，包括235B-A22B、30B-A3B及六个Dense模型，大幅提升数学、代码、逻辑推理和对话能力，达到业界领先水平。旗舰模型Qwen3-235B-A22B在多场景测试中表现优异，小型模型如Qwen3-4B性能媲美大模型。用户可在阿里云百炼平台免费体验各100万Token。

bailiantest1

9894 4 6

TsingtaoAI

|

10月前

|

存储人工智能前端开发

Google揭秘Agent架构三大核心：工具、模型与编排层实战指南

本文为Google发布的Agent白皮书全文翻译。本文揭示了智能体如何突破传统AI边界，通过模型、工具与编排层的三位一体架构，实现自主推理与现实交互。它不仅详解了ReAct、思维树等认知框架的运作逻辑，更通过航班预订、旅行规划等案例，展示了智能体如何调用Extensions、Functions和Data Stores，将抽象指令转化为真实世界操作。文中提出的“智能体链式组合”概念，预示了未来多智能体协作解决复杂问题的革命性潜力——这不仅是技术升级，更是AI赋能产业的范式颠覆。

TsingtaoAI

2870 1 5

蚝油菜花

|

机器学习/深度学习编解码人工智能

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

STAR 是由南京大学、字节跳动和西南大学联合推出的视频超分辨率框架，能够将低分辨率视频提升为高分辨率，同时保持细节清晰度和时间一致性。

蚝油菜花

2974 13 13

阿里云开发者学堂

热门文章

最新文章

相关电子书