|
29天前
|
缓存 人工智能 文字识别
|

大模型应用:多模态图文精准识别:基于本地化OCR模型应用实践.78

Qwen2-VL-OCR-2B是仅2B参数的轻量多模态OCR智能体,深度融合视觉感知与语言理解,可精准识别倾斜文字、复杂排版及多语言混合内容。支持CPU/GPU自动适配、指令式调用与全格式图片,本地部署安全高效,适用于文档、合同、海报等场景。

352 10
|
4月前
|
Web App开发 人工智能 JSON
|

深度测评:DeepSeek 对话导出工具 Top 3,公式不乱码、排版零折损的终极方案

本文为AI技术博主推荐三款高效导出DeepSeek对话的工具:专为iOS/macOS设计的“DS随心转”App,支持多格式且完美保留代码高亮与公式;轻量便捷的浏览器扩展“DeepSeek Share”,适用于Chrome等主流浏览器;以及内置在QQ浏览器中的导出功能,无需额外安装,适合日常快速存档。结合官方导出方式与使用建议,帮助用户根据设备与需求选择最佳方案,同时提醒注意数据隐私与兼容性问题。

1789 4
|
2月前
|
人工智能 弹性计算 自然语言处理
|

阿里云AI产品活动:千问焕新计划企业新客专享万亿Tokens扶持,1728元优惠券免费领

阿里云AI焕新季活动丰富,免费赠送1728元礼包,含个人与企业满减券。活动提供低价部署OpenClaw、阿里云百炼大模型服务节省计划低至4.5折、全模型通享4.5折,企业新客享万亿Tokens,云服务器38元起,还有组合购优惠。千问大模型适配多场景AI落地,具备多种模型能力。千问焕新计划提供最高2000元优惠券及多项权益。还提供低价云服务器、精选组合购,新迁入云享5亿补贴,助力企业AI转型。

612 4
|
9月前
|
数据可视化 物联网 开发者
|

深度解析四大LLM微调工具:从单卡到千亿级训练的四大解决方案

本文详解大语言模型微调四大工具——Unsloth、Axolotl、LlamaFactory、DeepSpeed,覆盖从单卡实验到万亿参数分布式训练场景,助你掌握主流框架选型策略,提升微调效率。建议点赞收藏。

3003 1
|
11月前
|

TortoiseSVN使用-合并分支代码

TortoiseSVN使用-合并分支代码

1754 1
|
7月前
|
自然语言处理 测试技术 API
|

通义Qwen3-Max:大就是好

通义千问Qwen3-Max正式发布,参数超1T,训练稳定高效,在代码、推理、多语言等任务中表现卓越。预览版已登顶LMArena榜单前三,支持阿里云百炼API调用与Qwen Chat体验,敬请试用。

3666 32
|
3月前
|
JSON 自然语言处理 API
|

大模型应用:语音转文本(ASR)实践:OpenAI Whisper精准转录解析.21

本文详解OpenAI Whisper语音转文本(ASR)技术,涵盖基础概念、模型选型(tiny至large-v3)、核心参数调优(language/temperature/beam_size等)、代码实战、词级时间戳、批量处理、说话人分离及音频降噪等进阶技巧,助力零基础用户快速上手并精准适配各类场景。

1281 117
|
29天前
|
弹性计算 人工智能 API
|

阿里云ECS云服务器快速部署OpenClaw实战|千问大模型Qwen3.6-Plus一站式配置教程

随着AI智能体技术不断成熟,OpenClaw(曾用名Clawdbot)已经成为轻量化、可扩展、高稳定性的开源AI执行框架代表。它能够将自然语言指令转化为真实可执行的系统操作、文件处理、信息检索、流程自动化任务,真正实现从“对话”到“执行”的落地。

645 29
|
2月前
|
机器学习/深度学习 算法 数据可视化
|

大模型应用:上下文理解极限:Context Window 与注意力跨度的数学边界.57

本文深入解析大模型长文本处理的三大核心概念:上下文窗口(输入长度上限)、注意力跨度(有效关注范围)与数学边界(算力/显存制约)。三者共同决定模型真实能力,而非仅看“128K”等宣传数字。理解它们是合理选型、优化提示、评估性能的关键。

652 10
|
2月前
|
存储 自然语言处理 并行计算
|

大模型应用:大模型量化:INT4与INT8核心差异、选型指南及代码实现.53

本文深入解析大模型INT4与INT8量化技术:从“缩放+映射”本质出发,对比二者在压缩率(75% vs 87.5%)、精度(256 vs 16离散值)、显存占用及适用场景的差异;详解scale/zero_point参数原理,并提供BitsAndBytes实战代码,助力高效本地部署。

842 6
|
11天前
|
人工智能
|

HappyHorse 1.0 系列模型使用指南

HappyHorse 1.0 是一款基于原生多模态架构的新一代 AI 视频生成模型,支持音视频协同生成;产品深度适配广告营销、电商展示、短剧制作与社交媒体创意等内容生产场景。

201 6
|
8月前
|
设计模式 算法 Java
|

软考中级软件设计师专项-设计模式篇

备战软考中级软件设计师?本文聚焦高分设计模式模块,详解23种模式的核心意图与场景,结合UML图、Java代码实例及历年真题,覆盖创建型、结构型、行为型三大类,助你打通理论到实战。

783 1
|
2月前
|
存储 缓存 自然语言处理
|

大模型应用:大模型运行全流程解析:从初始化加载→计算→结果输出.69

本文系统解析大模型推理全流程:从硬盘加载权重、CPU内存预处理、GPU显存计算,到自回归生成与自然语言解码。涵盖硬件协同(硬盘→内存→GPU)、软件步骤(分词、注意力、采样、后处理)及资源调度优化,揭示其软硬协同的本质。

394 3
|
7月前
|
测试技术
|

哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦

Qwen-Image-Edit基于20B Qwen-Image模型,融合视觉语义与外观控制,支持中英文文字精准编辑、风格迁移、IP创作等多重功能,具备SOTA性能,助力低门槛、高精度图像编辑。

3656 23
|
5月前
|
人工智能 自然语言处理 算法
|

6步走I 大模型备案《通关手册》

本文依据《生成式人工智能服务管理暂行办法》,梳理企业上线大模型服务所需的备案流程、材料及注意事项,涵盖“是否需备案”“六步备案法”“安全评估重点”“特殊行业提示”等内容,助力企业合规落地。

1137 0
|
6月前
|
人工智能 固态存储 Linux
|

树莓派这种“玩具级”设备,真能跑大模型吗?

本期教程带你用树莓派5部署Qwen3模型,打造完全离线、自带屏幕与键盘的“AI小终端”。基于C语言实现,不依赖Python或llama.cpp,支持多尺寸Qwen3模型,实现本地化私有推理。跟随步骤,轻松搭建属于你的端侧AI助手。

2072 168
|
10月前
|
存储 资源调度 并行计算
|

# Qwen3-8B 与 Qwen3-14B 的 TTFT 性能对比与底层原理详解

通义千问Qwen3系列是通义实验室2025年推出的最新大模型,包含多种参数版本,其中Qwen3-8B与Qwen3-14B均支持32K token上下文。Qwen3-8B参数量较小,响应更快,适合低延迟交互;Qwen3-14B参数更多,推理更强,适用于复杂任务。两者在TTFT、架构优化、量化技术及部署方案上各有侧重,满足多样应用场景需求。

5100 10
|
11月前
|
人工智能 Cloud Native 数据可视化
|

微医控股与阿里云达成战略合作,双方将携手基于通义千问大模型联合打造医疗全场景智能体,共同构建医疗垂类大模型

2025年6月17日,微医控股与阿里云达成战略合作,共建医疗AI基座及医疗全场景智能体。双方将基于通义千问大模型打造医疗垂类大模型,升级微医“5+1”智能体,并在诊断、用药、健康管理等环节深化应用。微医将结合阿里云技术优势推进IDC上云,助力AI+医疗基础设施建设,共同制定行业标准并推广城市级AI数字健共体。目前,微医AI服务已连接全国1.2万家医院和30万名医生,健康管理会员超100万。

2082 2
|
7月前
|
缓存 物联网 PyTorch
|

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型,涵盖模型转换、引擎构建、量化推理及LoRA微调等操作,并提供详细的代码示例与支持矩阵。

1884 2
|
1月前
|
编解码 人工智能 自然语言处理
|

#阿里云千问视觉模型实战:电商商品多视角图生成全流程解析

本文是阿里云千问视觉模型在电商商品图生成中的实战指南,详解其如何以0.1元/张、5秒生成的高效低成本,替代万元级传统拍摄,解决成本高、周期长、创意弱三大痛点,并附可运行代码与ROI分析。(239字)

356 5
|
1月前
|
人工智能 芯片
|

万相2.7,模型使用指南

万相2.7,拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从“演”迈向“导” 。

392 11
|
4月前
|
人工智能 算法 安全
|

2026新规 | AI聊天机器人上线需要办理什么资质?

AIGC浪潮下,AI聊天机器人爆发式增长,2025年上半年中国相关企业注册超5万家。随着《人工智能拟人化互动服务管理暂行办法》发布,合规成关键。本文详解上线必备资质:ICP备案、算法与大模型双备案、特殊行业许可及拟人化服务新规,构建“四层合规体系”,助企业规避风险,实现可持续发展。

1372 1
|
12月前
|
人工智能 安全 Android开发
|

手机也能跑通义Qwen3大模型,手把手教你部署!

全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通!借助MNN支持,适配Android、iOS及桌面端,实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。

5495 11
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型应用:本地大模型部署中的Token效率优化与性能分析.9

本文基于Qwen1.5-1.8B-Chat模型,构建了完整的Token监控与优化系统,深入分析对话中Token消耗模式,涵盖分词原理、多轮累积统计、上下文压缩、Prompt精简及响应长度控制等策略,为中小规模大模型的高效、低成本部署提供可复用方案。

1113 14
|
5月前
|
机器学习/深度学习 安全 API
|

MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!

MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。

3353 7
|
2月前
|
监控 并行计算 算法
|

大模型应用:多卡集群跑满14B模型:大模型推理算力应用实践.66

本项目面向10台RTX 4090集群,优化Qwen-14B大模型推理:通过NF4量化压缩显存、动态批处理(基于Amdahl定律)提升GPU利用率至85%+、多卡模型并行均衡负载,解决卡顿、显存溢出与调度不均问题,支撑日均10万次高并发稳定服务。

300 6
|
3月前
|
机器学习/深度学习 自然语言处理 并行计算
|

大模型应用:混合专家模型(MoE):大模型性能提升的关键技术拆解.37

MoE(混合专家模型)是一种高效大模型架构,通过“智能调度+稀疏激活”机制,让多个专业化子网络(专家)按需协作。它兼顾性能与效率:参数规模大但推理仅激活2-4个专家,显著降本提速;既保持通用能力,又在医疗、法律等细分领域更专精,是当前大模型落地的关键技术。

957 17
|
4月前
|
机器学习/深度学习 存储 人工智能
|

大模型部署算力账本:手把手教你算清GPU显存这笔账

本文详解大模型部署中GPU显存计算的关键:以Llama 70B为例,拆解模型权重、KV Cache、其他开销三大部分,揭示高并发下显存需求超1TB的真相,并提供量化、并行优化等降本策略,助你精准规划硬件投入,避免资源浪费或服务崩溃。

1662 2
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型应用:轻量化视觉语言模型(VLM):基于Qwen2-VL多模态模型实践.87

超紧凑视觉语言模型(如Qwen2-VL-2B)以仅20亿参数、约4GB体积,实现本地化图文理解与生成,支持CPU/入门GPU实时推理,兼顾精度与轻量部署,推动多模态AI走向终端、离线与普惠应用。

391 2
|
4月前
|
人工智能 自然语言处理 运维
|

构建AI智能体:一百、AI模型选择与部署考量:从业务需求到实际落地的思考决策

本文系统介绍了AI模型生态分类与选型方法论。主要内容包括:1)AI模型分类体系,分为通用大语言模型、文本嵌入模型和专业领域模型三大类;2)业务需求分析方法,从功能、性能、用户体验等维度进行需求拆解;3)模型选型决策框架,基于参数量、序列长度等指标建立四阶段评估流程;4)典型场景的模型选择建议,如智能客服推荐中等规模对话模型,内容创作选择大模型等。文章强调模型选择需平衡业务需求、技术指标和资源约束,并提供了代码示例说明不同模型的使用方法。最终指出没有最优模型,只有最适合特定场景的模型选择方案。

677 17
|
7月前
|
Go API 数据库
|

腾讯WeKnora 架构学习指南

《WeKnora架构学习指南》系统解析了这一腾讯开源的智能知识库项目,涵盖核心架构、技术栈、代码结构与学习路径。通过生活化类比和深度流程图解,帮助开发者从零掌握Go后端、Vue前端、RAG原理及微服务协同,提供四阶段进阶路线与实战建议,助力快速上手并参与贡献。

1516 3
|
1月前
|
机器学习/深度学习 存储 缓存
|

大模型架构算力对比:Decoder-only、Encoder-Decoder、MoE深度解析.71

本文深入解析三大主流大模型架构(Decoder-only、Encoder-Decoder、MoE)的算力消耗差异,聚焦注意力机制复杂度、参数量与计算密度三大维度。通过公式推导、代码模拟与可视化图表,揭示MoE稀疏激活的显著节算优势及瓶颈,剖析长文本场景下的“平方级算力黑洞”成因,并提供面向不同场景的架构选型建议。

517 20
|
5月前
|
编解码 人工智能 语音技术
|

📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat!

通义百聆开源Fun-Audio-Chat(8B),支持端到端语音交互,具备情感感知与任务执行能力。在多榜单同尺寸模型中排名第一,支持高精度语音理解、情感识别与Function Call,高效低延迟,已全面开放代码与权重,欢迎体验!

2154 10
|
7月前
|
人工智能 开发者
|

30分钟搞定媒体级新闻稿,这个AI提示词让技术人也能玩转公关写作

开发者常因新闻稿写作犯难,本文分享一套AI提示词工具,涵盖角色定义、结构化输入输出、多场景适配与合规检查,助力技术人快速生成符合媒体标准的专业稿件,提升传播效率。

1288 6
|
7月前
|
存储 人工智能 前端开发
|

超越问答:深入理解并构建自主决策的AI智能体(Agent)

如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。

1453 6
|
8月前
|
XML 存储 算法
|

5大实战技巧:优化RAG召回质量,避免“召回不足”灾难!

本文分享了团队在金融风控系统开发中优化RAG系统的实战经验,涵盖文档处理、召回策略与生成优化三大环节,解决召回不准、数据噪声等问题,助力构建高效精准的RAG系统。

1726 1
|
24天前
|
消息中间件 运维 安全
|

非得显卡?小模型跑在CPU上也照样快

Aether项目聚焦边缘/无GPU/私有化场景,用≤9B小模型构建高可用智能运维Agent:融合RAG知识库、分级意图路由、SOP式Skill编排与LoRA微调,兼顾数据安全、低资源消耗与强领域专业性。(238字)

273 2
|
2月前
|
人工智能 自然语言处理 数据可视化
|

【深度建议】打破设备壁垒:关于通义千问实现“全平台智能语音交互”与“知识闭环”的五大核心建议

作为通义千问深度用户,本文基于跨端真实体验,提出五大优化建议:①全平台语音输入引擎(补PC端短板);②沉浸式声音陪伴系统;③智能笔记与待办管理;④语义级长对话检索与跳转;⑤紧急修复移动端搜索点击失效Bug。聚焦效率与温度,助力千问成为更懂你的AI伙伴。(239字)

441 1
|
8月前
|
JSON API 网络安全
|

不能使用API

使用api 报错 Cannot connect to host dashscope.aliyuncs.com:443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1000)')] 🚨 异常: TranslationRecognizerRealtime has stopped.

1150 0
|
11月前
|
人工智能 自然语言处理 算法
|

AI企业必看:最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布,AI企业需快速掌握政策要求以确保合规运营。该办法明确指出,利用AI生成的内容(如文本、图片、音频、视频等)需通过显性标识(如“AI生成”字样)或隐性标识(如元数据、数字水印)进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外,应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言,合规已成为必修课,需重点关注标识的规范性和溯源能力,以应对即将到来的监管要求。

2241 1
|
14天前
|
数据采集 安全 数据挖掘
|

淘宝 API 接口详解:新手入门与开发场景指南

本文通俗解析淘宝API:它是淘宝官方开放的安全接口,支持商品/订单管理、数据服务、物流对接等,助力ERP开发、多店运营、选品分析与自动化营销。新手4步即可上手,合规高效,是电商数字化的核心工具。(239字)

162 0
|
2月前
|
分布式计算 小程序 Java
|

Java入门学习指南:从零基础到上手写代码(超详细,新手必看)

很多新手入门就急于下载软件、写代码,结果越学越乱。先花5分钟搞懂这3个问题,能帮你节省大量时间。

615 0
|
3月前
|
JavaScript Linux 开发者
|

Node.js 快速上手:核心特点 + 安装指南

Node.js是Claude Code、OpenAI Codex等AI编程工具的必备运行环境。本文详解其JavaScript全栈、非阻塞I/O、跨平台等核心特性,覆盖Windows/macOS/Linux三端LTS版一键安装方法及常见问题排查,助开发者快速配置本地开发环境。(239字)

1131 9
|
6月前
|
人工智能 弹性计算 自然语言处理
|

史上首次!万卡AI集群支撑双11,通义千问大规模落地

2025年双11,阿里云提供超千万核ECS算力及万卡灵骏智算集群,支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地,Qwen-MT单日调用超14亿次,助力商品出海、客服与经营分析,全面赋能双11智能化升级。

909 0
|
6月前
|
人工智能 自然语言处理 安全
|

直播带货效率提升300%:这个AI指令让技术人也能写出专业话术

技术人写直播话术太难?逻辑思维 vs 情感营销冲突大,学得慢、改得累。本文分享一套结构化AI指令,将专业带货方法论转化为可执行模板,支持多品类定制,30分钟生成高转化话术,助力开发者高效应对朋友求助或产品推广,轻松玩转直播文案。

1342 5
|
9月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

1620 23
|
11月前
|
机器学习/深度学习 人工智能 算法
|

通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。

1562 63
|
21天前
|
人工智能 监控 前端开发
|

大模型应用:基于安诊儿AntAngelMed模型+FastAPI构建慢病管理AI助手.86

本项目基于安诊儿AntAngelMed医疗大模型(临床一致率达88.9%),结合FastAPI后端与轻量前端,构建7×24小时慢病AI助手。支持糖尿病、高血压等居家咨询,提供专业、可读、结构化建议,并实时统计Token消耗,兼顾实用性与成本可控性。

227 2
|
2月前
|
并行计算 监控 PyTorch
|

大模型应用:大模型算力优化方案:识别突破隐性瓶颈达到效能最大化.65

本文深度剖析大模型落地中“算力跑不满”的隐性瓶颈,从系统(CUDA/驱动/OS)、模型(注意力冗余、激活函数、权重稀疏)、数据(加载、分词、格式)三维度拆解,并提供量化评估方法与场景化优化方案(个人开发/企业推理/边缘部署),助力榨干硬件潜力。

463 5

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

0
今日
1925
内容
8
活动
1365
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼