存储

首页 标签 存储
# 存储 #
关注
192511内容
|
6天前
| |
构建AI智能体:二十三、RAG超越语义搜索:如何用Rerank模型实现检索精度的大幅提升
本文介绍了重排序(Rerank)技术在检索增强生成(RAG)系统中的应用。Rerank作为初始检索和最终生成之间的关键环节,通过交叉编码器对初步检索结果进行精细化排序,筛选出最相关的少量文档提供给大语言模型。相比Embedding模型,Rerank能更精准理解查询-文档的语义关系,显著提高答案质量,降低Token消耗。文章详细比较了BGE-Rerank和CohereRerank等主流模型,并通过代码示例展示了Rerank在解决歧义查询(如区分苹果公司和水果)上的优势。
|
6天前
|
《LLM零开销抽象与插件化扩展指南》
本文聚焦C++在LLM系统落地中的核心赋能价值,围绕其强类型泛型编程、零开销抽象、内存布局控制、RAII机制及动态插件化五大核心特性展开。针对LLM多精度计算、复杂架构设计、缓存优化、长期稳定运行及快速迭代等关键需求,详解C++的编译期类型适配、静态多态、内存对齐、资源自动管理、动态链接库封装等实操方案。这些技术手段既解决了LLM系统“抽象设计与性能损耗”的核心矛盾,又提升了缓存利用率、保障了高并发场景稳定性,还支持系统灵活升级适配。
|
6天前
|
阿里云服务器带宽怎么选择?带宽值选多少兆合适?
阿里云服务器带宽如何选?轻量应用选1-5M,中小型网站建议5-20M,视频、下载等高并发场景建议50M以上。可结合CDN、OSS和弹性公网IP优化成本与性能,按实际流量或固定带宽计费,灵活调整更省钱。
AI 越智能,数据越危险?
阿里云提供AI全栈安全能力,为客户构建全链路数据保护体系,让企业敢用、能用、放心用
阿里云服务器带宽值多大合适?公网带宽多少M够用?
阿里云服务器带宽选择需根据实际场景:轻量应用选1-5M,中小型网站/API建议5-20M,视频、大文件下载等高并发业务建议50M以上。可结合CDN、OSS、弹性公网EIP和共享带宽降低成本,提升性能。
官宣 | Apache Fluss (Incubating) 0.8 发布公告
Apache Fluss 0.8(孵化中)正式发布!作为进入Apache后的首个版本,全面增强湖流一体能力,支持Iceberg与Lance,引入Delta Join、动态配置、Materialized Table等核心特性,显著提升稳定性与性能,推动实时流处理迈向新阶段。
|
6天前
|
官宣上线!RocketMQ for AI:企业级 AI 应用异步通信首选方案
RocketMQ推出专为AI场景优化的LiteTopic模型,助力企业应对AI应用长耗时、高算力成本与流量波动等挑战,支持异步通信、会话连续性与资源高效调度,已在阿里云及集团内部落地验证。
|
6天前
|
今天,世界互联网大会给我们颁了一个奖!
2025年世界互联网大会“领先科技奖”揭晓,通义千问凭借卓越性能及开源领域的全球领先地位获奖。其已开源300多个模型,下载量超6亿次,衍生模型逾17万个,居全球首位,广泛应用于金融、天文、医疗等领域,支持119种语言,服务百万用户。
|
7天前
| |
来自: 数据库
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构,并广泛应用于广告系统、日志平台和会员报表分析等典型场景,导入性能提升 3~30 倍,机器成本整体降低 55%、部分场景下高达 85%,每年节省数百万成本,综合效能提升 3~7 倍等显著收益,本文将详尽介绍基于 Doris 架构升级及在这些场景中的应用实践。
免费试用