TensorRT LLM 中的并行策略
TensorRT LLM提供多种GPU并行策略,支持大模型在显存与性能受限时的高效部署。涵盖张量、流水线、数据、专家及上下文并行,并推出宽专家并行(Wide-EP)应对大规模MoE模型的负载不均与通信挑战,结合智能负载均衡与优化通信核心,提升推理效率与可扩展性。
爬虫数据去重:BloomFilter算法实现指南
布隆过滤器(BloomFilter)是爬虫去重中高效的空间节省方案,适用于亿级URL去重。相比HashSet,内存占用降低80%以上,支持O(1)插入与查询,虽有少量误判但无漏判。本文详解其原理、参数调优、分布式实现及爬虫集成,助你应对大规模数据挑战。(238字)
从 VLDB‘25 看向量数据库发展方向:行业观察与技术前瞻
第 51 届国际大型数据库会议(The 51st International Conference on Very Large Data Bases,简称VLDB 2025)是数据管理、数据库系统与大规模数据处理领域最具影响力的国际顶级学术会议之一。本届 VLDB 在于2025 年 9 月 1 日至 9 月 5 日在英国伦敦Queen Elizabeth II Centre (QEII Centre) 举办。
OSS对象存储如何避免被攻击恶意刷流量?
当您的存储空间(Bucket)被恶意访问时,可能会出现高带宽或者大流量突发的情况,产生不必要的下行流量。严重情况下,还可能出现Bucket被切入沙箱,导致服务不可用。本文介绍如何避免OSS被攻击恶意刷流量。