大模型服务平台百炼

首页 标签 大模型服务平台百炼
# 大模型服务平台百炼 #
关注
2473内容
|
19小时前
| |
粗心了
MAXUR 是专为 Qwen3.5-9B 设计的轻量级诊断包(单文件、零外部依赖),内置动态稀疏注意力、自我反思门与上下文压缩器三大推理模块,通过**层替换**深度集成至模型架构,非hook挂载。开箱即用,显著降低幻觉(↓94.4%),提升事实性与长上下文稳定性。
|
20小时前
| |
Token中文新译名:「符元」——一文七个维度讲清Token的本质定义
拒绝“智元”走私语义,七维拆解 Token 物理本质,定义 AI 时代唯一真名:「符元」。
|
21小时前
| |
老生常谈之“大模型幻觉” ,今天我i动刀。
连通分量: 1 主分量: 222 节点 孤岛数: 0 桥接脆弱性: 4 个 (low) 低度节点: 5 高度枢纽: 8 Fiedler: 0.178513 ────────────────────────────────────────────────── ■ 模型商用体检报告 (独立产品, 可申请专利) ────────────────────────────────────────────────── 工单号: NSHP-52F30418 模型: ClientModel-Alpha (Qwen2.5-7B class) 参数: 7.0B 指标: hallucination_density
|
23小时前
| |
我在做一层面向 AI 系统和自动化系统的外部治理能力:让系统更可控、可审计、可冻结、可回放。
很多 AI 系统的问题,不是能力不够,而是缺少外部治理层。 我当前在做的不是让模型更聪明,而是让系统更可控:让动作可审计、风险可冻结、决策可回放、异常可恢复。 我更关注系统怎样进入生产,而不只是怎样做出结果。
|
1天前
| |
【SpringAIAlibaba新手村系列】(4)流式输出与响应式编程
本文围绕 Spring AI 中的流式输出与响应式编程展开,重点解释了传统一次性响应与流式返回的差异,以及 Flux 在异步数据流中的核心作用。文章结合 ChatModel.stream() 与 ChatClient 的多种代码示例,说明如何实现 AI 内容的边生成边返回,并帮助读者理解流式调用在用户体验、性能和长文本场景中的实际价值。
|
1天前
| |
吃透 Spring AI Alibaba 多智能体|四大协同模式+完整代码
本文详细讲解 Spring AI Alibaba Multi-Agent 多智能体架构,包含顺序执行、并行执行、LLM 路由、监督者四大协同模式,搭配可运行代码示例与真实业务场景,从零带你上手多智能体开发。
|
1天前
| |
使用Spring AI Alibaba构建智能体Agent
本文详解使用Spring AI Alibaba框架,结合DashScope和React Agent,通过两个实战案例(基础测试+生产级应用),教你快速构建Java AI智能体
|
1天前
| |
大模型应用:矩阵乘加(GEMM)全解析:大模型算力消耗的逻辑与优化.68
GEMM(矩阵乘加)是大模型算力核心,占Transformer计算量90%以上。本文系统解析其数学原理、高维适配、算力测算公式,并详解INT8/INT4量化、矩阵分块、硬件加速与批处理四大优化策略,结合代码示例与性能监控方法,助力高效推理落地。
|
2天前
| |
OpenClaw龙虾指南实操命令手册
本手册是OpenClaw智能体框架的权威命令参考,覆盖安装初始化、日常操作、高级配置、故障排查及运维管理全流程。含语法规则、参数说明、实战示例与避坑指南,支持新手入门与高手进阶,适配部署人员、新手用户及运维工程师。
免费试用