|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|
置顶

Qwen3:小而强,思深,行速

Qwen3(千问3)于北京时间4月29日凌晨发布,是Qwen系列大型语言模型的最新成员,具备全系列、开源最强、混合推理等特性。它包括两款MoE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)及六个Dense模型,支持119种语言。Qwen3在代码、数学和通用能力测试中超越行业顶尖模型,如DeepSeek-R1和Grok-3。其旗舰版Qwen3-235B-A22B仅需4张H20即可本地部署,成本为DeepSeek-R1的35%。此外,Qwen3原生支持思考模式与非思考模式切换,降低复杂任务门槛,并支持MCP协议优化Agent架构。

7741 2
|
9月前
|
测试技术 UED
|
置顶

全新开源通义千问Qwen3,它来了!

Qwen3是通义千问系列的最新模型,融合推理与非推理模式,兼具QwQ和Instruct模型能力。提供多种尺寸,包括235B-A22B、30B-A3B及六个Dense模型,大幅提升数学、代码、逻辑推理和对话能力,达到业界领先水平。旗舰模型Qwen3-235B-A22B在多场景测试中表现优异,小型模型如Qwen3-4B性能媲美大模型。用户可在阿里云百炼平台免费体验各100万Token。

8790 4
|
1天前
|
人工智能 API
|

重磅!阿里云Coding Plan全面上线四大顶流模型

阿里云百炼Coding Plan上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型。首购低至7.9元,大幅降低编码成本。

516 0
|
2天前
|
SQL 人工智能 自然语言处理
|

大模型应用:大模型与智能体(Agent)的核心差异:从定义到实践全解析.34

本文深入解析大模型(LLM)与智能体(AI Agent)的本质区别:大模型是“智能大脑”,专注语言理解与生成,被动响应、无记忆、无工具调用;智能体是“闭环系统”,以大模型为核心,集成规划、记忆、工具调用与反思能力,可主动执行复杂现实任务。通过概念、流程、实例多维对比,厘清二者在技术定位、能力边界与应用场景上的根本差异。

441 8
|
3月前
|
人工智能 前端开发 数据挖掘
|

AI学习全景图:从大模型到RAG,从工具到变现,一条从0到1的路线

告别碎片化学习!本文系统梳理AI知识五层结构:从基础认知到商业变现,提供完整学习路径与优质资源链接。帮你构建AI知识网络,实现从工具使用到能力落地的跃迁。

2774 3
|
3月前
|
人工智能 定位技术
|

千问APP来咯!会聊天,能办事,还免费!!

千问APP公测上线!基于全新Qwen3模型,打造全能AI助手,覆盖办公、地图、健康、购物等多场景,免费畅享智能聊天与办事体验。即刻下载,让AI成为你的日常伙伴。

4579 3
|
1月前
|
人工智能 程序员 决策智能
|

2026年智能体(Agent)怎么学?从入门到实战的全景避坑指南

2026年,AI进入“智能体元年”。本文系统解析智能体四大核心架构与Agentic Workflow设计模式,涵盖开发者、产品经理到业务人员的实战路径,助力把握AI代理红利期,实现从工具应用到架构创新的跃迁。

1236 5
|
9月前
|
传感器 人工智能 IDE
|

通义灵码编程智能体,上线!

通义灵码现在已经全面支持 Qwen3,并正式上线编程智能体,具备自主决策、环境感知、工具使用等能力,可以根据开发者的诉求,使用工程检索、文件编辑、终端等工具,端到端地完成编码任务。

813 148
|
3月前
|
Web App开发 人工智能
|

阿里千问“驻桌”,阿里重构PC生产力

2025年11月26日,阿里巴巴宣布其AI大模型千问与夸克AI浏览器完成深度融合,做到了从手机端到PC端的无缝衔接,办公效率大大提升,同时夸克AI浏览器也释放了千问模型的能力。

3377 0
|
6月前
|
存储 人工智能 自然语言处理
|

深度解析智能体工作流(Agentic Workflows):核心概念、模式与应用

本文系统解析智能体工作流(Agentic Workflow),结合AI智能体的推理、工具与记忆能力,实现复杂任务的动态执行。内容涵盖核心概念、关键模式及实际应用,帮助读者全面理解其价值与挑战。

5616 1
|
22天前
|
并行计算 API Docker
|

Docker+vLLM内网离线部署Qwen3 流程

本教程详解如何在A10四卡内网环境中,通过Docker+ vLLM离线部署Qwen3-32B/Qwen3-VL-30B-Instruct大模型。涵盖环境准备、镜像离线导入、模型下载、容器启动及参数调优,支持FP8/KV缓存/张量并行等高性能配置,助力安全高效私有化推理

695 5
|
16天前
|
人工智能 Cloud Native 语音技术
|

实战分享 | 抛弃本地Whisper,我用“通义千问+Paraformer”构建了一套B站收藏视频RAG知识库

本文分享如何用阿里云DashScope“全家桶”(Paraformer语音转写+Qwen-Max推理+Text-Embedding-v4向量化)替代本地Whisper,构建轻量、高效、高精度的B站视频RAG知识库,解决显存不足、转写慢、中英识别差等痛点,实测速度提升20倍以上。

890 6
|
传感器 机器学习/深度学习 弹性计算
|

Agent与大模型的区别

本文详细对比了人工智能领域的两个重要概念——Agent和大模型。大模型如GPT-3、BERT等,擅长自然语言处理任务,如文本生成、翻译等;Agent则是自主的软件实体,能够在特定环境中感知、决策并执行任务,如管理日程、控制智能家居等。文章介绍了它们的定义、功能、技术架构及应用场景,并总结了两者的核心差异和未来发展方向。

11199 26
|
人工智能 C++ iOS开发
|

ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码

本文介绍在Apple M4 MacOS环境下搭建Ollama和qwen2.5-coder模型的过程。首先通过官网或Brew安装Ollama,然后下载qwen2.5-coder模型,可通过终端命令`ollama run qwen2.5-coder`启动模型进行测试。最后,在VS Code中安装Continue插件,并配置qwen2.5-coder模型用于代码开发辅助。

23274 71
|
自然语言处理 搜索推荐 API
|

通义千问API:用4行代码对话大模型

本章将通过一个简单的例子,让你快速进入到通义千问大模型应用开发的世界。

244940 110
|
人工智能 文字识别 小程序
|

通义听悟--一个懂你的AI助理

介绍什么是通义听悟以及通义听悟的功能体验

21016 68
|
10月前
|
人工智能 达摩院 搜索推荐
|

通义大模型:解码中国AI的"通"与"义"

“通义”取自中国传统文化中“通晓大义”,寓意技术与人文的结合。作为阿里巴巴旗下的超大规模语言模型,通义在知识蒸馏、动态稀疏激活和文化感知模块上实现三大突破,大幅提升效率与适切性。其已在医疗、司法、文化传播等领域落地,如辅助病历处理、法律文书生成及文物解说等。测试显示,通义在中文诗歌创作、商业报告生成等方面表现优异。同时,开放的开发者生态已吸引5万+创新者。未来,通义将探索长期记忆、自我反思及多智能体协作,向AGI迈进,成为智能本质的载体。其对中文语境情感的精准把握,更是中国AI“通情达义”的典范。

3445 22
|
存储 人工智能 API
|

DeepSeek——DeepSeek模型部署实战

本文介绍了DeepSeek大模型的本地部署方法、使用方式及API接入。首先,通过下载Ollama平台部署DeepSeek-R1模型,提供7种不同参数版本(1.5b至671b),用户可根据硬件选择合适的模型大小。接着,文章详细描述了如何在终端运行命令启动模型,并通过Chatbox官网下载并接入DeepSeek API,实现本地和云端模型的交互。最后,提及了DeepSeek官网和集成工具如POE的使用,帮助用户更好地利用DeepSeek进行开发和应用。

2379 76
|
架构师 Linux Docker
|

三分钟让Dify接入Ollama部署的本地大模型!

本文详细介绍了如何在 Dify 中接入 Ollama 模型,包括模型添加、参数配置及常见问题解决。通过运行 Ollama 服务并与 qwen2:0.5b 模型交互,实现本地化大模型应用开发。同时提供了 Docker、Mac、Linux 和 Windows 平台上 Ollama 的部署与环境变量设置指南,帮助开发者快速上手。更多实战技巧可访问[编程严选网](http://www.javaedge.cn/)或关注作者的 Github 仓库。

9000 2
|
18天前
|
自然语言处理 Linux 语音技术
|

大模型应用:一文读懂TTS技术应用:基础入门到实战的全场景指南.18

本文系统讲解TTS(文本转语音)技术,涵盖原理、指标与实战:详解pyttsx3(离线)和gTTS(在线)两大入门方案,演示单文本播报、多语言生成、批量转换、情感模拟、实时提醒及Flask接口封装等全场景应用,并提供选型建议与常见问题解决方案。

456 10
|
人工智能 JavaScript 开发工具
|

【完全免费】VS Code 最好用的 12 款 AI 代码提示插件!!!

🎉 探索12款免费VSCode AI代码提示插件:Codeium、Codegeex、CodeFuse、TONGYI Lingma、Comate、iFlyCode、Fitten Code、Bito AI、Mintlify Doc Writer、Kodezi AI、aiXcoder、IntelliCode。这些插件提供智能补全、代码生成、注释、优化,支持多种语言,提升编程效率!🚀👩‍💻👨‍💻

21811 0
|
3月前
|
人工智能 Android开发 iOS开发
|

MNN × Qwen 实战:离线运行大模型的正确姿势

本期教程带你用MNN+Qwen在手机端部署大模型,从安装MNN Chat体验离线对话,到源码编译、模型转换与推理测试,再到Android/iOS移动端部署全流程实战,并提供精度与性能调优秘籍,助力端侧AI创新挑战赛。

2321 24
|
2月前
|
人工智能 自然语言处理 API
|

一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸

一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。

2354 153
|
5月前
|
人工智能 Java 机器人
|

基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API

Spring AI Alibaba集成Ollama,基于Java构建本地大模型应用,支持流式对话、knife4j接口可视化,实现高隐私、免API密钥的离线AI服务。

4750 2
|
2月前
|
数据可视化 前端开发 安全
|

AgentScope 1.0 全面进化,从原型走向产业落地!

AgentScope全新升级,打造生产级智能体生态:推出开箱即用的Alias、EvoTraders等应用,支持多场景落地;强化基建,实现动态技能扩展、白盒化运行与多语言支持;集成语音交互、数据工程等能力,提供从开发到部署的全链路解决方案。

1404 0
|
机器学习/深度学习 API 开发工具
|

通义千问API入门教程

本教程将带你从零开始,快速了解如何通过 API 使用通义千问大模型,并尝试使用大模型 API 开发一些简单的应用应用到工作中,提升效率。

40021 15
|
1月前
|
数据采集 人工智能 安全
|

从入门到精通:手把手教你用LLaMA Factory微调专属大模型

大家好,我是AI博主maoku老师。你是否觉得大模型“懂王”式回答不够专业?微调正是破局关键!本文带你深入浅出理解微调原理,掌握LoRA、量化、对话模板三大核心技术,并手把手教你用LLaMA Factory零代码实践,四步打造专属Web安全专家模型。从数据准备到部署应用,全程实战,助你将大模型从“通才”炼成“专才”,实现个性化、低成本、高效率的AI赋能。

829 1

通义万相2.5-图生视频-Preview,模型使用指南

该表格展示了多个设计场景,包括模型选择、复制粘贴提示词与图片、一键生成视频等步骤。每个步骤配有详细描述及示意图,呈现了不同主题和风格的设计构思与实现方式。

1939 6

Cursor + qwen2.5-coder 32b 的配置方式

安装Cursor后,进入设置修改OpenAI基础URL为阿里云的DashScope接口,并添加Qwen2.5-Coder 32B模型。需先访问阿里云百灵控制台申请免费Key。配置完成后,即可使用该模型进行开发和测试。

10603 2
|
11月前
|
数据安全/隐私保护 开发者 Python
|

使用 yt-dlp 二次开发, 快速下载 YouTube等平台高清视频工具开发

想从多个平台下载高清无水印视频?本文教你使用 `yt-dlp` 工具轻松实现!支持 YouTube、B站、抖音等主流平台,提供代码示例与解析,涵盖批量下载、字幕提取、音频分离等高级功能。无论你是开发者还是普通用户,都能快速上手,高效获取所需视频资源。

3049 0
|
20天前
|
机器学习/深度学习 人工智能 编解码
|

大模型应用:CLIP 模型全维度解析:理解理论基础强化基础范例.16

CLIP是OpenAI提出的跨模态模型,通过对比学习将图像与文本映射至统一语义空间,实现零样本图文对齐。无需微调即可完成图像分类、图文检索等任务,显著降低标注成本,成为多模态AI的核心基础。

348 21
|
1月前
|
Web App开发 人工智能 JSON
|

深度测评:DeepSeek 对话导出工具 Top 3,公式不乱码、排版零折损的终极方案

本文为AI技术博主推荐三款高效导出DeepSeek对话的工具:专为iOS/macOS设计的“DS随心转”App,支持多格式且完美保留代码高亮与公式;轻量便捷的浏览器扩展“DeepSeek Share”,适用于Chrome等主流浏览器;以及内置在QQ浏览器中的导出功能,无需额外安装,适合日常快速存档。结合官方导出方式与使用建议,帮助用户根据设备与需求选择最佳方案,同时提醒注意数据隐私与兼容性问题。

451 4

通义千问Image模型使用指南

该表格展示了多个设计场景,包括模型选择、复制粘贴提示词、一键生图等步骤。每个步骤配有详细描述及示意图,呈现了不同主题如商业海报、IP主视觉、品牌包装、街拍风格等的设计构思与实现方式。

1657 1
|
13天前
|
UED
|

最新版matlab r2025b安装图文教程(附安装包下载)方法

MATLAB R2025b发布:聚焦质量与稳定性提升,优化工具箱性能,修复R2025a已知Bug,增强可靠性。安装包已整合,可前往xu5软件库(www.xu5.cc)一键下载,附详细图文安装及激活教程。

212 6
|
人工智能 API
|

通过API调用通义千问时出现DataInspectionFailed的解决办法(玄学版)

在使用qwen-plus API进行长文本翻译时,遇到了DataInspectionFailed错误,提示输入数据可能包含不当内容。尽管确认文本无敏感内容,但误判依然发生。通过将每个分段的字符数从1000降低到700,问题得以解决。建议在处理长文本时,减少每次请求的字符数以避免误判。

4850 6
|
人工智能 API 开发者
|

阿里云通义千问向全社会开放!

阿里云通义千问向全社会开放!

66619 37
|
1月前
|
机器学习/深度学习 人工智能 缓存
|

构建AI智能体:九十八、实践出真知:本地AI大模型部署的核心要点与经验总结

本文介绍了如何在个人电脑上加载和运行轻量级AI大语言模型。首先解析了大语言模型的基本概念和工作原理,包括Tokenizer、Prompt等关键术语。然后详细演示了三种模型加载方式:通过ModelSpace下载Qwen模型、使用HuggingFace加载BERT模型、利用SentenceTransformer获取句子嵌入。特别强调了在CPU环境下的配置技巧,如设置torch.float32数据类型和优化内存使用。文章还提供了完整的中文对话生成示例代码,展示了Qwen1.5-1.8B-Chat模型的实际应用效果

474 6
|
4月前
|
并行计算 PyTorch 算法框架/工具
|

vLLM 架构学习指南

本指南深入解析vLLM高性能推理引擎架构,涵盖核心创新PagedAttention与连续批处理技术,结合代码结构、学习路径与实践建议,系统指导用户从入门到贡献源码的全过程。

2015 3
|
2月前
|
机器学习/深度学习 安全 API
|

MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!

MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。

2559 7
|
4月前
|
人工智能 算法 开发者
|

一个提示词模板,搞定抖音短视频脚本创作

专为技术人打造的抖音脚本提示词模板,结构化拆解短视频创作套路,结合DeepSeek、通义千问等AI工具,快速生成可执行脚本框架,助力技术分享、产品演示高效落地,30秒讲清重点,开头抓人、节奏紧凑、完播率提升。

2370 12
|
7月前
|
存储 资源调度 并行计算
|

# Qwen3-8B 与 Qwen3-14B 的 TTFT 性能对比与底层原理详解

通义千问Qwen3系列是通义实验室2025年推出的最新大模型,包含多种参数版本,其中Qwen3-8B与Qwen3-14B均支持32K token上下文。Qwen3-8B参数量较小,响应更快,适合低延迟交互;Qwen3-14B参数更多,推理更强,适用于复杂任务。两者在TTFT、架构优化、量化技术及部署方案上各有侧重,满足多样应用场景需求。

4223 10
|
缓存 自然语言处理 并行计算
|

基于NVIDIA A30 加速卡推理部署通义千问-72B-Chat测试过程

本文介绍了基于阿里云通义千问72B大模型(Qwen-72B-Chat)的性能基准测试,包括测试环境准备、模型部署、API测试等内容。测试环境配置为32核128G内存的ECS云主机,配备8块NVIDIA A30 GPU加速卡。软件环境包括Ubuntu 22.04、CUDA 12.4.0、PyTorch 2.4.0等。详细介绍了模型下载、部署命令及常见问题解决方法,并展示了API测试结果和性能分析。

5570 1
|
人工智能
|

本地离线部署大模型知识库OLLAMA+Anything(保姆级)

本地离线部署大模型知识库OLLAMA+Anything(保姆级)

6855 3
|
8月前
|
机器学习/深度学习 自然语言处理 测试技术
|

Qwen3技术报告首次全公开!“混合推理模型”是这样炼成的

近日,通义千问Qwen3系列模型已开源,其技术报告也正式发布。Qwen3系列包含密集模型和混合专家(MoE)模型,参数规模从0.6B到235B不等。该模型引入了“思考模式”与“非思考模式”的动态切换机制,并采用思考预算机制优化推理性能。Qwen3支持119种语言及方言,较前代显著提升多语言能力,在多个基准测试中表现领先。此外,通过强到弱蒸馏技术,轻量级模型性能优异,且计算资源需求更低。所有Qwen3模型均采用Apache 2.0协议开源,便于社区开发与应用。

6256 30
|
2月前
|
编解码 人工智能 语音技术
|

📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat!

通义百聆开源Fun-Audio-Chat(8B),支持端到端语音交互,具备情感感知与任务执行能力。在多榜单同尺寸模型中排名第一,支持高精度语音理解、情感识别与Function Call,高效低延迟,已全面开放代码与权重,欢迎体验!

1514 10
|
3月前
|
SQL 自然语言处理 关系型数据库
|

构建AI智能体:二十九、Text2SQL:告别繁琐SQL!用大模型自助生成数据报表

Text2SQL技术通过自然语言处理将用户查询转换为SQL语句,解决企业数据查询效率低下的痛点。该技术包含语义理解、模式对齐、SQL生成和优化等核心处理过程,核心组件包括自然语言理解模块、Schema管理模块和SQL生成模块。文章介绍了闭源和开源模型的选择策略,并提供了基于Function Calling的Text2SQL实现示例,展示如何安全高效地将自然语言转换为数据库查询。

1530 4
|
11天前
|
存储 缓存 并行计算
|

大模型应用:LlamaIndex 与 LangChain 深度集成构建本地化RAG系统.25

本文详解LlamaIndex与LangChain协同构建本地化RAG系统:以Qwen1.5-1.8B-Chat为基座,通过轻量化验证与工程化落地两阶段示例,实现文档索引、语义检索、提示编排与问答生成全链路本地化,兼顾准确性、可控性与可扩展性。

153 11
|
6月前
|
存储 人工智能 算法
|

​​向量数据库终极指南:AI开发者的进阶手册​

本文深入解析向量数据库的原理与实战应用,涵盖其在AI系统中的核心作用、关键技术(如HNSW、PQ、LSH)、相似性搜索、元数据过滤及无服务器架构优势。适合开发者和AI从业者学习提升。

1774 1
|
自然语言处理 前端开发 Serverless
|

基于阿里云通义千问开发编程辅助与代码生成工具

随着软件开发需求的增加,编程辅助与代码生成工具成为开发者提高效率的利器。这类工具能够根据用户描述生成代码片段、协助调试、生成自动化脚本等,大大减少重复性劳动。阿里云通义千问作为一款先进的大语言模型,具备强大的自然语言处理和代码生成能力,非常适合用于开发这样的工具。

2345 3
|
自然语言处理 IDE Java
|

通义灵码真好用!

通义灵码小白体验手把手教程,真的很好用呢!

2420 4

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

4
今日
1755
内容
8
活动
1170
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼