千问大模型-第2页-阿里云开发者社区

AI未闻花名

|

29天前

|

缓存人工智能文字识别

|

博文

大模型应用：多模态图文精准识别：基于本地化OCR模型应用实践.78

Qwen2-VL-OCR-2B是仅2B参数的轻量多模态OCR智能体，深度融合视觉感知与语言理解，可精准识别倾斜文字、复杂排版及多语言混合内容。支持CPU/GPU自动适配、指令式调用与全格式图片，本地部署安全高效，适用于文档、合同、海报等场景。

352 10 11

DS随心转

|

4月前

|

Web App开发人工智能 JSON

|

博文

深度测评：DeepSeek 对话导出工具 Top 3，公式不乱码、排版零折损的终极方案

本文为AI技术博主推荐三款高效导出DeepSeek对话的工具：专为iOS/macOS设计的“DS随心转”App，支持多格式且完美保留代码高亮与公式；轻量便捷的浏览器扩展“DeepSeek Share”，适用于Chrome等主流浏览器；以及内置在QQ浏览器中的导出功能，无需额外安装，适合日常快速存档。结合官方导出方式与使用建议，帮助用户根据设备与需求选择最佳方案，同时提醒注意数据隐私与兼容性问题。

1789 4 4

小陈写代码

|

2月前

|

人工智能弹性计算自然语言处理

|

博文

阿里云AI产品活动：千问焕新计划企业新客专享万亿Tokens扶持，1728元优惠券免费领

阿里云AI焕新季活动丰富，免费赠送1728元礼包，含个人与企业满减券。活动提供低价部署OpenClaw、阿里云百炼大模型服务节省计划低至4.5折、全模型通享4.5折，企业新客享万亿Tokens，云服务器38元起，还有组合购优惠。千问大模型适配多场景AI落地，具备多种模型能力。千问焕新计划提供最高2000元优惠券及多项权益。还提供低价云服务器、精选组合购，新迁入云享5亿补贴，助力企业AI转型。

612 4 4

聚客AI

|

9月前

|

数据可视化物联网开发者

|

博文

深度解析四大LLM微调工具：从单卡到千亿级训练的四大解决方案

本文详解大语言模型微调四大工具——Unsloth、Axolotl、LlamaFactory、DeepSpeed，覆盖从单卡实验到万亿参数分布式训练场景，助你掌握主流框架选型策略，提升微调效率。建议点赞收藏。

3003 1 1

刘大猫.

|

11月前

|

博文

TortoiseSVN使用-合并分支代码

1754 1 1

bailiantest1

|

7月前

|

自然语言处理测试技术 API

|

博文

通义Qwen3-Max：大就是好

通义千问Qwen3-Max正式发布，参数超1T，训练稳定高效，在代码、推理、多语言等任务中表现卓越。预览版已登顶LMArena榜单前三，支持阿里云百炼API调用与Qwen Chat体验，敬请试用。

3666 32 33

AI未闻花名

|

3月前

|

JSON 自然语言处理 API

|

博文

大模型应用：语音转文本（ASR）实践：OpenAI Whisper精准转录解析.21

本文详解OpenAI Whisper语音转文本（ASR）技术，涵盖基础概念、模型选型（tiny至large-v3）、核心参数调优（language/temperature/beam_size等）、代码实战、词级时间戳、批量处理、说话人分离及音频降噪等进阶技巧，助力零基础用户快速上手并精准适配各类场景。

1281 117 121

小鲸云

|

29天前

|

弹性计算人工智能 API

|

博文

阿里云ECS云服务器快速部署OpenClaw实战｜千问大模型Qwen3.6-Plus一站式配置教程

随着AI智能体技术不断成熟，OpenClaw（曾用名Clawdbot）已经成为轻量化、可扩展、高稳定性的开源AI执行框架代表。它能够将自然语言指令转化为真实可执行的系统操作、文件处理、信息检索、流程自动化任务，真正实现从“对话”到“执行”的落地。

645 29 29

AI未闻花名

|

2月前

|

机器学习/深度学习算法数据可视化

|

博文

大模型应用：上下文理解极限：Context Window 与注意力跨度的数学边界.57

本文深入解析大模型长文本处理的三大核心概念：上下文窗口（输入长度上限）、注意力跨度（有效关注范围）与数学边界（算力/显存制约）。三者共同决定模型真实能力，而非仅看“128K”等宣传数字。理解它们是合理选型、优化提示、评估性能的关键。

652 10 11

AI未闻花名

|

2月前

|

存储自然语言处理并行计算

|

博文

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

本文深入解析大模型INT4与INT8量化技术：从“缩放+映射”本质出发，对比二者在压缩率（75% vs 87.5%）、精度（256 vs 16离散值）、显存占用及适用场景的差异；详解scale/zero_point参数原理，并提供BitsAndBytes实战代码，助力高效本地部署。

842 6 6

游客rk4rdj2luf4h6

|

11天前

|

人工智能

|

博文

HappyHorse 1.0 系列模型使用指南

HappyHorse 1.0 是一款基于原生多模态架构的新一代 AI 视频生成模型，支持音视频协同生成；产品深度适配广告营销、电商展示、短剧制作与社交媒体创意等内容生产场景。

201 6 7

varin

|

8月前

|

设计模式算法 Java

|

博文

软考中级软件设计师专项-设计模式篇

备战软考中级软件设计师？本文聚焦高分设计模式模块，详解23种模式的核心意图与场景，结合UML图、Java代码实例及历年真题，覆盖创建型、结构型、行为型三大类，助你打通理论到实战。

783 1 2

AI未闻花名

|

2月前

|

存储缓存自然语言处理

|

博文

大模型应用：大模型运行全流程解析：从初始化加载→计算→结果输出.69

本文系统解析大模型推理全流程：从硬盘加载权重、CPU内存预处理、GPU显存计算，到自回归生成与自然语言解码。涵盖硬件协同（硬盘→内存→GPU）、软件步骤（分词、注意力、采样、后处理）及资源调度优化，揭示其软硬协同的本质。

394 3 3

探索云世界

|

7月前

|

测试技术

|

博文

哪里不对改哪里！全能图像编辑模型Qwen-Image-Edit来啦

Qwen-Image-Edit基于20B Qwen-Image模型，融合视觉语义与外观控制，支持中英文文字精准编辑、风格迁移、IP创作等多重功能，具备SOTA性能，助力低门槛、高精度图像编辑。

3656 23 24

AIGC合规

|

5月前

|

人工智能自然语言处理算法

|

博文

6步走I 大模型备案《通关手册》

本文依据《生成式人工智能服务管理暂行办法》，梳理企业上线大模型服务所需的备案流程、材料及注意事项，涵盖“是否需备案”“六步备案法”“安全评估重点”“特殊行业提示”等内容，助力企业合规落地。

1137 0 0

bailiantest1

|

6月前

|

人工智能固态存储 Linux

|

博文

树莓派这种“玩具级”设备，真能跑大模型吗？

本期教程带你用树莓派5部署Qwen3模型，打造完全离线、自带屏幕与键盘的“AI小终端”。基于C语言实现，不依赖Python或llama.cpp，支持多尺寸Qwen3模型，实现本地化私有推理。跟随步骤，轻松搭建属于你的端侧AI助手。

2072 168 170

喜欢猪猪

|

10月前

|

存储资源调度并行计算

|

博文

# Qwen3-8B 与 Qwen3-14B 的 TTFT 性能对比与底层原理详解

通义千问Qwen3系列是通义实验室2025年推出的最新大模型，包含多种参数版本，其中Qwen3-8B与Qwen3-14B均支持32K token上下文。Qwen3-8B参数量较小，响应更快，适合低延迟交互；Qwen3-14B参数更多，推理更强，适用于复杂任务。两者在TTFT、架构优化、量化技术及部署方案上各有侧重，满足多样应用场景需求。

5100 10 10

bailiantest1

|

11月前

|

人工智能 Cloud Native 数据可视化

|

博文

微医控股与阿里云达成战略合作，双方将携手基于通义千问大模型联合打造医疗全场景智能体，共同构建医疗垂类大模型

2025年6月17日，微医控股与阿里云达成战略合作，共建医疗AI基座及医疗全场景智能体。双方将基于通义千问大模型打造医疗垂类大模型，升级微医“5+1”智能体，并在诊断、用药、健康管理等环节深化应用。微医将结合阿里云技术优势推进IDC上云，助力AI+医疗基础设施建设，共同制定行业标准并推广城市级AI数字健共体。目前，微医AI服务已连接全国1.2万家医院和30万名医生，健康管理会员超100万。

2082 2 3

八进智

|

7月前

|

缓存物联网 PyTorch

|

博文

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型，涵盖模型转换、引擎构建、量化推理及LoRA微调等操作，并提供详细的代码示例与支持矩阵。

1884 2 2

新答案

|

22天前

|

人工智能开发者弹性计算

|

问答

什么是大模型Qwen3.5-Omni？2026年阿里云大模型Qwen3.5-Omni介绍及活动说明

269 0 0

我的linux生涯

|

1月前

|

编解码人工智能自然语言处理

|

博文

#阿里云千问视觉模型实战：电商商品多视角图生成全流程解析

本文是阿里云千问视觉模型在电商商品图生成中的实战指南，详解其如何以0.1元/张、5秒生成的高效低成本，替代万元级传统拍摄，解决成本高、周期长、创意弱三大痛点，并附可运行代码与ROI分析。（239字）

356 5 5

游客rk4rdj2luf4h6

|

1月前

|

人工智能芯片

|

博文

万相2.7，模型使用指南

万相2.7，拥有全面的创作控制力，将AI的能力从单一素材生成扩至创作全链路，从“演”迈向“导” 。

392 11 11

众森企服陈老师

|

4月前

|

人工智能算法安全

|

博文

2026新规 | AI聊天机器人上线需要办理什么资质？

AIGC浪潮下，AI聊天机器人爆发式增长，2025年上半年中国相关企业注册超5万家。随着《人工智能拟人化互动服务管理暂行办法》发布，合规成关键。本文详解上线必备资质：ICP备案、算法与大模型双备案、特殊行业许可及拟人化服务新规，构建“四层合规体系”，助企业规避风险，实现可持续发展。

1372 1 1

bailiantest1

|

12月前

|

人工智能安全 Android开发

|

博文

手机也能跑通义Qwen3大模型，手把手教你部署！

全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通！借助MNN支持，适配Android、iOS及桌面端，实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。

5495 11 12

AI未闻花名

|

4月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

大模型应用：本地大模型部署中的Token效率优化与性能分析.9

本文基于Qwen1.5-1.8B-Chat模型，构建了完整的Token监控与优化系统，深入分析对话中Token消耗模式，涵盖分词原理、多轮累积统计、上下文压缩、Prompt精简及响应长度控制等策略，为中小规模大模型的高效、低成本部署提供可复用方案。

1113 14 15

bailiantest1

|

5月前

|

机器学习/深度学习安全 API

|

博文

MAI-UI 开源：通用 GUI 智能体基座登顶 SOTA！

MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型，原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清，通过大规模在线强化学习实现复杂任务自动化，在出行、办公等高频场景中表现卓越，已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。

3353 7 14

AI未闻花名

|

2月前

|

监控并行计算算法

|

博文

大模型应用：多卡集群跑满14B模型：大模型推理算力应用实践.66

本项目面向10台RTX 4090集群，优化Qwen-14B大模型推理：通过NF4量化压缩显存、动态批处理（基于Amdahl定律）提升GPU利用率至85%+、多卡模型并行均衡负载，解决卡顿、显存溢出与调度不均问题，支撑日均10万次高并发稳定服务。

300 6 6

AI未闻花名

|

3月前

|

机器学习/深度学习自然语言处理并行计算

|

博文

大模型应用：混合专家模型（MoE）：大模型性能提升的关键技术拆解.37

MoE（混合专家模型）是一种高效大模型架构，通过“智能调度+稀疏激活”机制，让多个专业化子网络（专家）按需协作。它兼顾性能与效率：参数规模大但推理仅激活2-4个专家，显著降本提速；既保持通用能力，又在医疗、法律等细分领域更专精，是当前大模型落地的关键技术。

957 17 18

游客o2s7skhdnny24

|

4月前

|

机器学习/深度学习存储人工智能

|

博文

大模型部署算力账本：手把手教你算清GPU显存这笔账

本文详解大模型部署中GPU显存计算的关键：以Llama 70B为例，拆解模型权重、KV Cache、其他开销三大部分，揭示高并发下显存需求超1TB的真相，并提供量化、并行优化等降本策略，助你精准规划硬件投入，避免资源浪费或服务崩溃。

1662 2 3

AI未闻花名

|

20天前

|

机器学习/深度学习人工智能自然语言处理

|

博文

大模型应用：轻量化视觉语言模型（VLM）：基于Qwen2-VL多模态模型实践.87

超紧凑视觉语言模型（如Qwen2-VL-2B）以仅20亿参数、约4GB体积，实现本地化图文理解与生成，支持CPU/入门GPU实时推理，兼顾精度与轻量部署，推动多模态AI走向终端、离线与普惠应用。

391 2 2

AI未闻花名

|

4月前

|

人工智能自然语言处理运维

|

博文

构建AI智能体：一百、AI模型选择与部署考量：从业务需求到实际落地的思考决策

本文系统介绍了AI模型生态分类与选型方法论。主要内容包括：1）AI模型分类体系，分为通用大语言模型、文本嵌入模型和专业领域模型三大类；2）业务需求分析方法，从功能、性能、用户体验等维度进行需求拆解；3）模型选型决策框架，基于参数量、序列长度等指标建立四阶段评估流程；4）典型场景的模型选择建议，如智能客服推荐中等规模对话模型，内容创作选择大模型等。文章强调模型选择需平衡业务需求、技术指标和资源约束，并提供了代码示例说明不同模型的使用方法。最终指出没有最优模型，只有最适合特定场景的模型选择方案。

677 17 18

八进智

|

7月前

|

Go API 数据库

|

博文

腾讯WeKnora 架构学习指南

《WeKnora架构学习指南》系统解析了这一腾讯开源的智能知识库项目，涵盖核心架构、技术栈、代码结构与学习路径。通过生活化类比和深度流程图解，帮助开发者从零掌握Go后端、Vue前端、RAG原理及微服务协同，提供四阶段进阶路线与实战建议，助力快速上手并参与贡献。

1516 3 4

AI未闻花名

|

1月前

|

机器学习/深度学习存储缓存

|

博文

大模型架构算力对比：Decoder-only、Encoder-Decoder、MoE深度解析.71

本文深入解析三大主流大模型架构（Decoder-only、Encoder-Decoder、MoE）的算力消耗差异，聚焦注意力机制复杂度、参数量与计算密度三大维度。通过公式推导、代码模拟与可视化图表，揭示MoE稀疏激活的显著节算优势及瓶颈，剖析长文本场景下的“平方级算力黑洞”成因，并提供面向不同场景的架构选型建议。

517 20 21

bailiantest1

|

5月前

|

编解码人工智能语音技术

|

博文

📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat！

通义百聆开源Fun-Audio-Chat（8B），支持端到端语音交互，具备情感感知与任务执行能力。在多榜单同尺寸模型中排名第一，支持高精度语音理解、情感识别与Function Call，高效低延迟，已全面开放代码与权重，欢迎体验！

2154 10 10

huizhudev

|

7月前

|

人工智能开发者

|

博文

30分钟搞定媒体级新闻稿，这个AI提示词让技术人也能玩转公关写作

开发者常因新闻稿写作犯难，本文分享一套AI提示词工具，涵盖角色定义、结构化输入输出、多场景适配与合规检查，助力技术人快速生成符合媒体标准的专业稿件，提升传播效率。

1288 6 6

dt_7992973394!

|

7月前

|

存储人工智能前端开发

|

博文

超越问答：深入理解并构建自主决策的AI智能体(Agent)

如果说RAG让LLM学会了“开卷考试”，那么AI智能体（Agent）则赋予了LLM“手和脚”，使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构，讲解ReAct等关键工作机制，并带你一步步构建一个能够调用外部工具（API）的自定义Agent，开启LLM自主解决复杂任务的新篇章。

1453 6 6

聚客AI

|

8月前

|

XML 存储算法

|

博文

5大实战技巧：优化RAG召回质量，避免“召回不足”灾难！

本文分享了团队在金融风控系统开发中优化RAG系统的实战经验，涵盖文档处理、召回策略与生成优化三大环节，解决召回不准、数据噪声等问题，助力构建高效精准的RAG系统。

1726 1 1

小伟(tiger)

|

24天前

|

消息中间件运维安全

|

博文

非得显卡？小模型跑在CPU上也照样快

Aether项目聚焦边缘/无GPU/私有化场景，用≤9B小模型构建高可用智能运维Agent：融合RAG知识库、分级意图路由、SOP式Skill编排与LoRA微调，兼顾数据安全、低资源消耗与强领域专业性。（238字）

273 2 2

徒手开榴莲

|

2月前

|

人工智能自然语言处理数据可视化

|

博文

【深度建议】打破设备壁垒：关于通义千问实现“全平台智能语音交互”与“知识闭环”的五大核心建议

作为通义千问深度用户，本文基于跨端真实体验，提出五大优化建议：①全平台语音输入引擎（补PC端短板）；②沉浸式声音陪伴系统；③智能笔记与待办管理；④语义级长对话检索与跳转；⑤紧急修复移动端搜索点击失效Bug。聚焦效率与温度，助力千问成为更懂你的AI伙伴。（239字）

441 1 2

游客vw5ywvrprfs56

|

8月前

|

JSON API 网络安全

|

博文

不能使用API

使用api 报错 Cannot connect to host dashscope.aliyuncs.com:443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1000)')] 🚨 异常: TranslationRecognizerRealtime has stopped.

1150 0 0

老赵聊算法备案、大模型备案

|

11月前

|

人工智能自然语言处理算法

|

博文

AI企业必看：最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布，AI企业需快速掌握政策要求以确保合规运营。该办法明确指出，利用AI生成的内容（如文本、图片、音频、视频等）需通过显性标识（如“AI生成”字样）或隐性标识（如元数据、数字水印）进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外，应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言，合规已成为必修课，需重点关注标识的规范性和溯源能力，以应对即将到来的监管要求。

2241 1 1

游客l43us3h6fwwpu

|

14天前

|

数据采集安全数据挖掘

|

博文

淘宝 API 接口详解：新手入门与开发场景指南

本文通俗解析淘宝API：它是淘宝官方开放的安全接口，支持商品/订单管理、数据服务、物流对接等，助力ERP开发、多店运营、选品分析与自动化营销。新手4步即可上手，合规高效，是电商数字化的核心工具。（239字）

162 0 0

9589

|

2月前

|

分布式计算小程序 Java

|

博文

Java入门学习指南：从零基础到上手写代码（超详细，新手必看）

很多新手入门就急于下载软件、写代码，结果越学越乱。先花5分钟搞懂这3个问题，能帮你节省大量时间。

615 0 1

南朝旧事

|

3月前

|

JavaScript Linux 开发者

|

博文

Node.js 快速上手：核心特点 + 安装指南

Node.js是Claude Code、OpenAI Codex等AI编程工具的必备运行环境。本文详解其JavaScript全栈、非阻塞I/O、跨平台等核心特性，覆盖Windows/macOS/Linux三端LTS版一键安装方法及常见问题排查，助开发者快速配置本地开发环境。（239字）

1131 9 9

阿里云

|

6月前

|

人工智能弹性计算自然语言处理

|

博文

史上首次！万卡AI集群支撑双11，通义千问大规模落地

2025年双11，阿里云提供超千万核ECS算力及万卡灵骏智算集群，支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地，Qwen-MT单日调用超14亿次，助力商品出海、客服与经营分析，全面赋能双11智能化升级。

909 0 0

huizhudev

|

6月前

|

人工智能自然语言处理安全

|

博文

直播带货效率提升300%：这个AI指令让技术人也能写出专业话术

技术人写直播话术太难？逻辑思维 vs 情感营销冲突大，学得慢、改得累。本文分享一套结构化AI指令，将专业带货方法论转化为可执行模板，支持多品类定制，30分钟生成高转化话术，助力开发者高效应对朋友求助或产品推广，轻松玩转直播文案。

1342 5 5

bailiantest1

|

9月前

|

人机交互 API 开发工具

|

博文

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型，支持文本、图像、音频和视频的输入，并输出文本和音频。Omni-Realtime服务针对实时交互场景优化，提供低延迟的人机交互体验。

1620 23 24

bailiantest1

|

11月前

|

机器学习/深度学习人工智能算法

|

博文

通义OmniAudio大模型，让 AI 看懂 360° 视频，并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术，能够直接从 360° 视频生成 FOA（First-order Ambisonics）空间音频，为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调，OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集，支持高质量的模型训练与评估。代码、数据及论文均已开源，助力沉浸式体验技术发展。

1562 63 63

AI未闻花名

|

21天前

|

人工智能监控前端开发

|

博文

大模型应用：基于安诊儿AntAngelMed模型+FastAPI构建慢病管理AI助手.86

本项目基于安诊儿AntAngelMed医疗大模型（临床一致率达88.9%），结合FastAPI后端与轻量前端，构建7×24小时慢病AI助手。支持糖尿病、高血压等居家咨询，提供专业、可读、结构化建议，并实时统计Token消耗，兼顾实用性与成本可控性。

227 2 2

AI未闻花名

|

2月前

|

并行计算监控 PyTorch

|

博文

大模型应用：大模型算力优化方案：识别突破隐性瓶颈达到效能最大化.65

本文深度剖析大模型落地中“算力跑不满”的隐性瓶颈，从系统（CUDA/驱动/OS）、模型（注意力冗余、激活函数、权重稀疏）、数据（加载、分词、格式）三维度拆解，并提供量化评估方法与场景化优化方案（个人开发/企业推理/边缘部署），助力榨干硬件潜力。

463 5 5

最新

热门文章

产品问答

大模型应用：多模态图文精准识别：基于本地化OCR模型应用实践.78

深度测评：DeepSeek 对话导出工具 Top 3，公式不乱码、排版零折损的终极方案

阿里云AI产品活动：千问焕新计划企业新客专享万亿Tokens扶持，1728元优惠券免费领

深度解析四大LLM微调工具：从单卡到千亿级训练的四大解决方案

TortoiseSVN使用-合并分支代码

通义Qwen3-Max：大就是好

大模型应用：语音转文本（ASR）实践：OpenAI Whisper精准转录解析.21

阿里云ECS云服务器快速部署OpenClaw实战｜千问大模型Qwen3.6-Plus一站式配置教程

大模型应用：上下文理解极限：Context Window 与注意力跨度的数学边界.57

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

HappyHorse 1.0 系列模型使用指南

软考中级软件设计师专项-设计模式篇

大模型应用：大模型运行全流程解析：从初始化加载→计算→结果输出.69

哪里不对改哪里！全能图像编辑模型Qwen-Image-Edit来啦

6步走I 大模型备案《通关手册》

树莓派这种“玩具级”设备，真能跑大模型吗？

# Qwen3-8B 与 Qwen3-14B 的 TTFT 性能对比与底层原理详解

微医控股与阿里云达成战略合作，双方将携手基于通义千问大模型联合打造医疗全场景智能体，共同构建医疗垂类大模型

使用TensorRT LLM构建和运行Qwen模型

什么是大模型Qwen3.5-Omni？2026年阿里云大模型Qwen3.5-Omni介绍及活动说明

#阿里云千问视觉模型实战：电商商品多视角图生成全流程解析

万相2.7，模型使用指南

2026新规 | AI聊天机器人上线需要办理什么资质？

手机也能跑通义Qwen3大模型，手把手教你部署！

大模型应用：本地大模型部署中的Token效率优化与性能分析.9

MAI-UI 开源：通用 GUI 智能体基座登顶 SOTA！

大模型应用：多卡集群跑满14B模型：大模型推理算力应用实践.66

大模型应用：混合专家模型（MoE）：大模型性能提升的关键技术拆解.37

大模型部署算力账本：手把手教你算清GPU显存这笔账

大模型应用：轻量化视觉语言模型（VLM）：基于Qwen2-VL多模态模型实践.87

构建AI智能体：一百、AI模型选择与部署考量：从业务需求到实际落地的思考决策

腾讯WeKnora 架构学习指南

大模型架构算力对比：Decoder-only、Encoder-Decoder、MoE深度解析.71

📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat！

30分钟搞定媒体级新闻稿，这个AI提示词让技术人也能玩转公关写作

超越问答：深入理解并构建自主决策的AI智能体(Agent)

5大实战技巧：优化RAG召回质量，避免“召回不足”灾难！

非得显卡？小模型跑在CPU上也照样快

【深度建议】打破设备壁垒：关于通义千问实现“全平台智能语音交互”与“知识闭环”的五大核心建议

不能使用API

AI企业必看：最新结果标识合规要求及规范

淘宝 API 接口详解：新手入门与开发场景指南

Java入门学习指南：从零基础到上手写代码（超详细，新手必看）

Node.js 快速上手：核心特点 + 安装指南

史上首次！万卡AI集群支撑双11，通义千问大规模落地

直播带货效率提升300%：这个AI指令让技术人也能写出专业话术

基于通义多模态大模型的实时音视频交互

通义OmniAudio大模型，让 AI 看懂 360° 视频，并“听”出对应的空间音频

大模型应用：基于安诊儿AntAngelMed模型+FastAPI构建慢病管理AI助手.86

大模型应用：大模型算力优化方案：识别突破隐性瓶颈达到效能最大化.65

千问大模型

活跃用户

相关产品