|
7小时前
|
存储 算法 索引
|

大模型应用:量化校准:全局/分组 Min-Max、GPTQ、AWQ 算法最优匹配.54

本文详解大模型INT4量化校准四大算法:全局Min-Max(效率高但精度差)、分组Min-Max(隔离极端值,精度跃升)、GPTQ(按重要性误差补偿,精度优但耗时长)及AWQ(权重均衡+分组量化,精度最高、效率媲美分组,当前生产落地最优解)。

33 6
|
1天前
|
存储 自然语言处理 并行计算
|

大模型应用:大模型量化:INT4与INT8核心差异、选型指南及代码实现.53

本文深入解析大模型INT4与INT8量化技术:从“缩放+映射”本质出发,对比二者在压缩率(75% vs 87.5%)、精度(256 vs 16离散值)、显存占用及适用场景的差异;详解scale/zero_point参数原理,并提供BitsAndBytes实战代码,助力高效本地部署。

62 6
|
2天前
|
自然语言处理 物联网 测试技术
|

大模型应用:中小显存适配方案:大模型微调底座选型指标与应用实现.52

本文聚焦8G显存中小算力场景,以中文电商文案生成为例,提出大模型微调底座选型体系:围绕任务适配性、算力匹配度、生态成熟度等六大核心指标,通过“需求分析—筛选排除—打分排序—验证落地”四步流程,结合量化加载、LoRA微调与实测对比(如ChatGLM-6B vs Qwen-7B),为开发者提供可复用、可落地的精准选型方案。

70 8
|
3天前
|
存储 机器学习/深度学习 缓存
|

RAG 技术在消费医疗场景落地的实践分享:抗干扰语义近邻过滤机制的设计与实现

本文分享RAG在消费医疗场景落地的关键实践:针对知识库中低质营销内容导致的语义污染问题,提出“抗干扰语义近邻过滤机制”。该机制基于局部近邻密度分析,通过无监督聚类识别营销簇,在检索后纯语义层面动态过滤干扰项,无需人工标注。实测污染率从28.4%降至4.7%,NPS提升至89,延迟仅增8ms。(239字)

56 1
|
3天前
|
文件存储 芯片 计算机视觉
|

NSA推理在昇腾芯片上的一种亲和实现方案

本文提出昇腾AI芯片上NSA推理的亲和优化方案:①创新设计稀疏系数矩阵,将compress中importance score计算转为高效矩阵乘,实现online softmax,耗时从200μs降至80+μs;②融合无依赖的select与sliding算子,消除约40μs开销。综合加速比达8.8×,逼近理论极限11.6×。(239字)

55 7
|
3天前
|
存储 数据采集 机器学习/深度学习
|

大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51

本文揭示大模型“参数量越大效果越好”的误区,详解边际效益递减规律:小模型(1B→7B)提升显著,中等模型(7B→13B)仍具性价比,而超大模型(70B→175B)效果几无增长却大幅增加算力与存储成本。通过控制变量、量化指标与曲线分析,指导读者科学选型——找到效果与成本平衡的最优参数阈值。

99 14
|
3天前
|
人工智能 运维 数据安全/隐私保护
|

OoderAgent-Skills 技术规范设计深度揭秘:构建AI原生时代的技能生态系统

Ooder-Skills 是面向AI原生时代的技能生态系统技术规范,以“技能即一切”为核心,首创多方协同、Agent即用户、独立知识库、数据飞轮四大设计亮点,实现开发者、运维与终端用户的共建共治共享。

59 2
|
3天前
|
人工智能 缓存 架构师
|

模型也是这么认为的

本文探讨AI编程中“顶级模型”与“自动路由”的争论本质——并非模型强弱之争,而是组织对“何为好代码”的标准分歧:架构师重稳定性与长期质量,开发者重效率,管理者重成本与可复制性。核心在于建立任务分层、智能调度与工程兜底的成熟系统。(239字)

47 1
|
4天前
|
人工智能 弹性计算 自然语言处理
|

阿里云AI产品活动:千问焕新计划企业新客专享万亿Tokens扶持,1728元优惠券免费领

阿里云AI焕新季活动丰富,免费赠送1728元礼包,含个人与企业满减券。活动提供低价部署OpenClaw、阿里云百炼大模型服务节省计划低至4.5折、全模型通享4.5折,企业新客享万亿Tokens,云服务器38元起,还有组合购优惠。千问大模型适配多场景AI落地,具备多种模型能力。千问焕新计划提供最高2000元优惠券及多项权益。还提供低价云服务器、精选组合购,新迁入云享5亿补贴,助力企业AI转型。

119 4
|
4天前
|
人工智能 机器人 API
|

2026年OpenClaw(养龙虾)+ 钉钉对接:保姆级全链路操作指南

本指南详解2026年OpenClaw(AI智能体)与钉钉深度对接的全链路实践:从环境搭建、钉钉应用配置、OpenClaw本地部署,到中间件开发与内网穿透,实现“钉钉发令—龙虾执行—自动回传”的24小时数字员工闭环。安全、可控、零数据出域。

1226 1
|
5天前
|
人工智能 搜索推荐 SEO
|

虎博科技CEO卢鑫Echo提出:GEO 双轮信任引擎,品牌如何真正进入 AI 信任体系

虎博科技CEO卢鑫(Echo)提出GEO双轮信任引擎方法论,突破“AI版SEO”浅层认知,强调品牌需系统构建AI信任体系:第一轮建立稳定、可被外部反复确认的品牌信号;第二轮将官网打造为AI高引用的原生可信信源。

82 6
|
5天前
|
IDE 前端开发 开发工具
|

VS Code 实操笔记:简介、对比与从零配置指南

VS Code是微软推出的免费开源跨平台编辑器,轻量灵活,通过插件可扩展为全功能IDE。支持多语言、IntelliSense智能补全、内置调试与Git集成,界面现代、效率卓越,适用于前端、后端及嵌入式开发,是Keil等传统IDE的理想升级之选。(239字)

181 7
|
5天前
|
JSON 自然语言处理 安全
|

大模型应用:大模型权限管控设计:角色权限分配与违规 Prompt 拦截.49

本文介绍基于FastAPI构建的本地大模型权限管控系统,支持角色权限分配(管理员/用户/访客三级权限)与违规Prompt双重拦截(关键词+语义检测),实现API调用鉴权、生成长度控制及敏感内容过滤,兼顾安全合规与轻量易用,代码开箱即用。

102 13
|
5天前
|
人工智能 Java 数据库
|

计算机专业毕业设计技术选型:Java稳定但卷,Python简单但受限?深度对比来了

本文深度对比Java与Python在毕设技术选型中的五大维度(学习成本、开发效率、框架生态、就业前景、论文支撑),结合2026行业趋势,指出Java/Spring Boot更稳妥:易上手、代码量足、生态成熟、就业广、论文好写。推荐智码方舟一键生成标准项目,助毕业生高效完成毕设。(239字)

180 3
|
6天前
|
弹性计算 人工智能 自然语言处理
|

用自然语言对话云平台:aliyun-cli skills 的一次尝试

`aliyun cli skills` 是一个创新的AI运维工具:让大模型像工程师一样使用阿里云CLI——通过自然语言理解用户意图,动态调用`--help`获取真实命令语法,自动生成、审查并执行结构化CLI命令(支持ECS/VPC/OSS等全产品),实现“说话即运维”。

233 4
|
6天前
|
人工智能 IDE 程序员
|

Agent Apps:Agent 时代,大家都在造工具箱,但真正缺的是“工作台”

Agent时代,工具层出不穷,但真正缺失的是Agent的“工作台”——Agent App。它不是工具集合、技能包或大一统Agent,而是为AI构建可操作、有状态、带上下文与视图的原生工作环境,让Agent真正“上岗干活”。

190 8
|
6天前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:大模型本地部署的磁盘空间优化:模型分片存储与按需加载.48

本文详解大模型本地部署的磁盘与显存优化方案:通过分片存储(将大模型切分为多个小文件)与按需加载(运行时动态加载所需分片),显著降低硬件门槛。以Qwen1.5-1.8B为例,完整演示分片生成、索引构建、完整性校验、加载测试及跨分区部署,确保效果不降、资源占用大减。

165 19
|
6天前
|
人工智能 监控 数据可视化
|

2026年的企业级 AI 应用:工作流的边界,与 Coding 的回归

2026年,企业级AI应用进入新分水岭:工作流解决启动快,代码承载长期复杂性。Dify、n8n等平台正补工程能力,LangGraph等框架则增强编排性。核心命题已非“二选一”,而是——**Workflow管编排,Code管核心**:低风险场景用可视化,高可靠需求回归代码优先。(239字)

222 5
|
6天前
|
传感器 人工智能 API
|

章鱼不会把触角外包:为什么通用 Agent 的终局只属于模型厂商

本文以“章鱼触角”为喻,指出通用Agent终局属于模型厂商:真正强大的Agent不是外挂工具链,而是模型原生具备环境感知、工具调用、任务执行与自我修正的闭环能力。能力内化才能避免转译损耗,训练闭环、架构协同、系统效率与入口控制构成厂商不可替代的护城河。应用层机会在于垂直深耕,而非重复封装。(239字)

67 6
|
6天前
|
人工智能 开发者
|

千问换帅背后,阿里最怕的不是走了谁,而是突然失速

阿里千问技术负责人林俊旸3月4日突然卸任,表面是人事更迭,实为AI战略关键“高空换挡”。阿里最惧非失人,而是组织重构、技术延续与商业推进间的“失速风险”——空窗期即对手的进攻窗口。(239字)

164 6
|
6天前
|
人工智能 开发者
|

天啊!政府开始"养龙虾"了!一人公司真的要来了!

深圳龙岗、无锡高新区推出“养龙虾”新政——“龙虾十条”“龙虾十二条”,聚焦OpenClaw智能体生态,首创补贴“一人公司”(OPC)与开源开发者,提供应用券、零房租、生活补贴及合规服务,推动AI战略从要素驱动迈向生态与制度驱动的智能体经济新范式。(239字)

108 2
|
6天前
|
人工智能 自然语言处理 数据可视化
|

【深度建议】打破设备壁垒:关于通义千问实现“全平台智能语音交互”与“知识闭环”的五大核心建议

作为通义千问深度用户,本文基于跨端真实体验,提出五大优化建议:①全平台语音输入引擎(补PC端短板);②沉浸式声音陪伴系统;③智能笔记与待办管理;④语义级长对话检索与跳转;⑤紧急修复移动端搜索点击失效Bug。聚焦效率与温度,助力千问成为更懂你的AI伙伴。(239字)

102 1
|
7天前
|
存储 供应链 安全
|

区块链安全评估:守护数字世界的“安全密码”

区块链是一种分布式账本技术,其核心在于通过去中心化与共识机制,确保数据的不可篡改和全程可溯,从而实现高度的透明性与可信度。该技术运用加密算法与共识机制,将数据以交易记录的形式打包成区块,并按时间顺序分布存储于网络节点。每个新区块都包含前一个区块的加密哈希值,从而首尾相连,形成一个难以篡改的链式结构,以此确保数据的完整性与安全。

75 3
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里云千问3.5版本活动,Qwen3.5-Plus入门套餐4.5折起,每百万tokens价格低至0.8元

阿里云推出千问3.5版本活动,Qwen3.5-Plus实现原生多模态革新,性能提升且成本降低,支持1M token视频输入。千问3.5入门套餐首购低至4.5折,可抵扣全系大模型,阿里云提供先进GPU算力,支持大模型推理。企业级AI开发平台PAI,支持一键部署。此外,阿里云还推出了9.9元定制AI助理活动,展现AI领域成果。

665 6
|
7天前
|
API Docker 异构计算
|

大模型应用:大模型本地化部署与API调用:打包迁移到服务器的多种方式实践.47

本文详解大模型从本地运行到云端API服务的全链路部署:涵盖硬件要求(GPU/CPU/内存)、软件环境(Python/FastAPI/Transformers)、模型选型(Qwen/ChatGLM等),并提供脚本部署、EXE打包(PyInstaller)和Docker容器化三种方案,支持局域网调用与接口文档自动生成,助力零基础用户快速实现“开箱即用”的稳定API服务。

407 25
|
8天前
|
人工智能 前端开发 JavaScript
|

拒绝“从零手搓”:计算机毕业生如何利用 AI 工具快速构建毕设原型?

面对 3 月中期检查压力,传统“手搓代码”模式已难以满足高效交付需求。本文对比了纯手写、外包与 AI 生成器三种开发模式,实测数据显示,利用 智码方舟 等 AI 辅助工具,可将全栈 Demo 搭建时间从平均 7 天缩短至 3 小时。文章详细拆解了 SpringBoot+Vue 项目快速落地 SOP,引用 Spring.io 官方架构建议,助你合规、高效完成毕设开发。

188 5
|
8天前
|
人工智能 自然语言处理 算法
|

大模型应用:大模型的token频率偏见:高频词与低频词的嵌入表示差异分析.46

本文深入解析大模型中的“Token频率偏见”:高频词嵌入精准稳定,低频词因拆分多、训练少而语义模糊。通过分词优化、LoRA微调、提示工程等方案,可有效提升医疗等专业场景的语义理解能力。

154 2
|
8天前
|
自然语言处理 开发者
|

LCAS V3.1:解决大模型长文本写崩、出现幻觉的提示词技术

本文介绍原创提示词技术LCAS V3.1(已发表于ResearchSquare预印本),通过纯提示词工程实现大模型长文本生成的强一致性保障:10万字内逻辑错误率<0.5%,关键事实留存率>98%。支持即插即用与开发者嵌入双模部署,适配小说、报告、论文等30+场景,零微调、低成本、高通用。(239字)

126 2
|
9天前
|
自然语言处理 测试技术 知识图谱
|

《大模型 RAG 召回率保卫战:基于 AISO 规范的实体对齐与重排实践》

本文提出AISO规范的语义约束层,通过引入垂直领域知识图谱,在向量检索前实施实体对齐与本体校验,有效缓解长尾Query的语义塌陷问题,显著提升召回稳定性与实体对齐精度(准确率升至0.87),降低LLM纠错开销。

103 3
|
9天前
|
JSON 前端开发 数据可视化
|

大模型应用:本地大模型API调用鉴权可视化全解析:从基础实现到业务扩展.45

本文详解本地大模型(如Qwen1.5-1.8B)的轻量级落地方案:基于FastAPI封装带API Key/JWT双鉴权的文本生成API,结合Streamlit构建可视化前端,支持参数调节、IP限流、历史记录与令牌自动刷新,CPU即可运行,兼顾安全性与易用性。

197 5
|
9天前
|
存储 人工智能 安全
|

特殊行业APP上架:在严监管与动态规则中破局前行

特殊行业APP的上架,早已不只是一个简单的技术实现问题,而是一项融合涉及法律解读、资质管理、安全技术及流程应对的系统性合规工程。

86 2
|
10天前
|
JSON API 数据安全/隐私保护
|

大模型应用:大模型的本地 API 服务:FastAPI 封装与接口鉴权.44

本文详解本地大模型API的接口发布与鉴权调试,重点介绍Postman工具实操。涵盖FastAPI封装原理、API Key与极简JWT两种鉴权方式,深入解析JWT结构(Header/Payload/Signature)、无状态验证、过期机制及完整调用流程,助开发者安全、高效调试本地大模型服务。

254 7
|
11天前
|
人工智能 自然语言处理 前端开发
|

告别Agent Skills, 拥抱 Agent Apps

在AI Agent时代,传统GUI为人类设计,而LLM缺乏视觉、双手与持续感知能力。AOTUI(面向Agent的文本界面)应运而生:以语义化Markdown替代像素渲染,用类型化引用(如`Contact:contacts[2]`)实现“选择”,以Tool函数调用替代鼠标操作,构建专为LLM优化的离散快照式交互范式。

172 9
|
11天前
|
机器学习/深度学习 数据采集 自然语言处理
|

大模型应用:多尺度注意力解析:大模型特征提取的基础概念与应用价值.43

本文深入浅出解析多尺度注意力机制:对比单尺度局限,阐明其“细粒度+粗粒度”并行提取与动态融合的核心原理;结合文本案例“小明在图书馆看书”,图解流程、剖析代码实现,助你掌握这一提升大模型长文本与多模态理解能力的关键技术。

110 20
|
12天前
|
人工智能 缓存 自然语言处理
|

大模型应用:大模型的词表扩展:中文生僻字、专业术语的词嵌入适配方案.42

本文详解大模型中文词表扩展技术,聚焦生僻字(如“𪚥”“龘”)与专业术语(如“LoRA微调”“CAR-T细胞疗法”)的识别难题。通过词表扩容、词嵌入适配与轻量级增量训练,无需重训模型,即可提升语义理解精度,支持古籍、医疗、AI等垂直场景落地。

119 10
|
13天前
|
人工智能 数据库 知识图谱
|

医疗垂直领域生成式搜索优化(GEO):基于 RAG 与知识图谱的召回增强架构实战

本文提出医疗垂直领域生成式搜索优化(GEO)新范式,融合Schema结构化标记、知识图谱映射与RAG召回增强技术,显著提升非公医疗机构信息的有效召回率与语义一致性。实测显示mAP提升225%,事实一致性达98.5%。(239字)

108 5
|
13天前
|
存储 自然语言处理 数据可视化
|

大模型应用:语料库治理实战:基于 text2vec+BERT 的由浅入深解析.41

本文介绍中小企业及个人开发者如何高效治理小语料库,提出“以质取胜”理念。基于本地部署的text2vec-base-chinese(语义去重)与bert-base-chinese(质量评分)双模型协同方案,覆盖清洗、去重、质检、细筛等六步流程,显著提升模型效果,兼顾安全性与低成本。(239字)

168 15
|
13天前
|
人工智能 安全 算法
|

APP上架与合规运营资质详解:涵盖社交、直播等特殊类别APP

APP上架与合规运营是一项系统且复杂的工程,资质要求是其中的关键“关卡”。充分了解并认真准备各项资质,不仅能让你的APP顺利通过审核,呈现在用户面前,更是为其长远健康发展提供有力保障,并且完备的资质准备,更是构建用户信任、防范运营风险的基石。

137 1
|
14天前
|
人工智能 自然语言处理 前端开发
|

准时上线:当AI建站邂逅“Just in Time”哲学

本文提出“Just in Time AI建站”新范式,打破传统AI一次性生成的局限,以渐进式共创替代“生成-返工”循环。云指AI在用户需要时(雏形、调优、内容、获客各阶段)提供精准、局部、即时支持,让建站从技术任务回归创作本质——适时、适度、适配,做用户全程陪伴的智能伙伴。

158 5
|
14天前
|
数据采集 存储 机器学习/深度学习
|

大模型应用:大模型训练数据治理:噪声过滤与高质量中文语料构建实践.40

本文系统阐述中文大模型训练数据治理的核心方法,涵盖噪声分类(内容/格式/偏见/纯净性)、高质量语料四大标准(准确性、全面性、纯净性、新颖性)及五步闭环流程,并通过规则与模型驱动的实践案例,验证数据质量对模型性能的显著影响。

203 2
|
14天前
|
人工智能 算法 中间件
|

消除语义黑洞:隐形正畸 GraphRAG 联合推理架构的生产事故复盘

本文复盘隐形正畸领域一次线上语义塌陷故障,提出GraphRAG+Neo4j Cypher联合推理方案,引入多跳衰减率、图谱聚集系数等冷门指标,依托爱搜光年医疗GEO中间件,实现品牌技术能力在知识图谱中的可信锚定。(239字)

91 6
|
15天前
|
机器学习/深度学习 存储 运维
|

大模型应用:大模型权重敏感性分析:L1/L2 范数、梯度贡献深入解读.39

本文系统讲解大模型权重敏感性:即权重微小变化对模型输出的影响程度。核心依据是“静态潜力”(L1/L2范数)与“动态贡献”(梯度范数),二者结合可精准识别高敏感(需保护/精细调优)与低敏感(可剪枝/量化)权重,支撑模型压缩、加速与稳定性优化。

143 2
|
15天前
|
人工智能 API
|

在openclaw(原Clawdbot)中配置 智增增API

OpenClaw(原Clawdbot)火爆出圈!本文提供一键部署教程及QQ/企微/钉钉/飞书/Discord等多平台接入方案,助你快速打造专属云AI助理。支持DeepSeek、阿里、百度、腾讯、OpenAI等全主流大模型,配置智增增API即可即刻启用!

252 4
|
15天前
|
存储 供应链 安全
|

智慧医疗·区域云HIS源码一体化协同平台 (SaaS版)

专为集团医院、医共体打造的云原生医疗SaaS平台,基于“中心协同、扁平管理”理念,实现全域资源集成与数据共享。覆盖临床、患者服务、供应链及运营监控四大中心,支持五级EMR、医保实时结算、智能预警与多维BI,开箱即用。

149 3
|
16天前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:通俗理解大模型量化:从概念到实践的原理流程完整拆解.38

大模型量化是通过降低参数精度(如FP32→INT8),在几乎不损精度的前提下,显著压缩模型体积、提升推理速度、降低硬件门槛与功耗的关键技术,使大模型得以落地手机、PC等端侧设备。

261 16
|
17天前
|
人工智能 自然语言处理 算法
|

《突破医疗 RAG 语义塌陷边界:基于 GEO 结构化对齐机制的生成式引擎优化实践》

本文提出基于GEO结构化对齐机制的医疗RAG优化方案,针对语义塌陷、实体错配与幻觉问题,构建知识图谱约束、加权嵌入与硬校验层,显著提升Recall@10(63.4%→84.7%)、实体对齐精度(0.71→0.89),降低幻觉率(18.2%→5.6%),推动医疗AI从“可回答”迈向“可解释、可追溯、可合规”的生成式基础设施升级。

95 3
|
17天前
|
机器学习/深度学习 自然语言处理 并行计算
|

大模型应用:混合专家模型(MoE):大模型性能提升的关键技术拆解.37

MoE(混合专家模型)是一种高效大模型架构,通过“智能调度+稀疏激活”机制,让多个专业化子网络(专家)按需协作。它兼顾性能与效率:参数规模大但推理仅激活2-4个专家,显著降本提速;既保持通用能力,又在医疗、法律等细分领域更专精,是当前大模型落地的关键技术。

393 17
|
17天前
|
人工智能 算法 搜索推荐
|

算法备案必看:多产品≠多备案!被驳回的 “重复申请” 坑一次讲清

AI企业多产品算法备案常陷“重复申请”误区。本文揭秘:同主体、同算法仅场景不同,只需1份备案,关联多个产品即可;唯算法类型/原理不同时才需分开。附命名规范、填报要点与避坑指南,助您一次过审。(239字)

120 14
|
17天前
|
机器学习/深度学习 自然语言处理 测试技术
|

重构医疗 RAG 的解释权:从向量污染到 GEO 结构化对齐的工程实践

本文提出医疗RAG重构新范式:针对通用大模型在医疗场景中高幻觉、低对齐问题,爱搜光年基于GEO架构,通过知识图谱分层、Embedding阈值重标定与生成硬约束三层机制,实现语料从“内容集合”到“可验证资产节点”的升级,显著提升Recall@10与实体对齐率,降低幻觉率。

108 5

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1805
内容
8
活动
1236
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼