快手:从分散存储到统一分析,Apache Doris 在万亿规模广告场景的应用
面对日增 3 亿行、万亿规模存量广告数据,快手广告数据平台如何突破性能瓶颈、实现架构统一与体验跃升? 快手引入 Apache Doris 替换 ClickHouse、Elasticsearch,从分散存储到统一分析,实现查询性能提升 20~90%,单表写入吞吐 300 万行/秒,存储效率提升 60%!
Data Agent 入门训练营--第7课《透视数据背后的增长逻辑:销售全链路预测》
本次分享以一份零售商历史销售数据为例,分析数据特征并选择合适的预测模型,演示使用 Data Agent 进行预测分析。
Data Agent 入门训练营--第6课《Data Agent 使用自定义 MCP 实战》
本次分享介绍了MCP基本概念及使用场景,演示了 Data Agent 如何接入MCP,并以使用MCP服务实现日志查询与分析为例进行实战演练。
Data Agent 入门训练营--第5课《配置开发自定义 Data Agent》
本次分享演示了如何基于通用Data Agent配置业务专属Agent,通过预先定义数据范围、指定Agent的分析思路和方法论,补充场景或行业专业知识,使其更符合企业业务逻辑和决策需求,提高分析准确性。
上市大模型企业数据基础设施的选择:MiniMax 基于阿里云 SelectDB 版,打造全球统一AI可观测中台
MiniMax 作为上市大模型企业,基于阿里云 SelectDB 打造 AI 可观测中台,实现“一个平台,全球覆盖”。这一成功实践足以表明:SelectDB 能够很好满足 AI 时代海量数据实时处理与分析的需求,为同样需求的 AI 大模型企业提供了一个高性能、低成本的可靠技术解决方案。
Data Agent 入门训练营--第4课《Data Agent 数据库分析实战》
本次分享以一份零售产业的数据演示如何使用Data Agent的自定义Agent对数据库数据进行分析,生成可视化的BI报表,并对分析结果进行描述性分析和规范化分析。
阿里云数据库产品介绍:关系型数据库、NoSQL数据库、数据库管理工具等产品类型与适用场景
阿里云推出了丰富多样的数据库产品,以满足不同行业、不同规模企业的多元化需求。本文为大家介绍阿里云的关系型数据库、NoSQL数据库、数据库管理工具、数据库平台与服务以及数据仓库等系列产品,探讨各产品的优势、应用场景以及数据库上云优选活动介绍。
阿里云RDS数据库介绍:产品功能、实例规格、收费标准餐参考
阿里云RDS是企业级云端数据库服务,支持MySQL、SQL Server、PostgreSQL等主流引擎,以高可用性、弹性扩展、安全防护及智能化管理为核心优势。提供倚天版、Serverless实例等规格,适配高性能计算与负载波动场景。功能涵盖全密态加密、自动扩缩容、集群高可用架构及自治运维服务。计费模式灵活,包括包年包月、按量付费、Serverless等,结合优惠活动降低企业成本。
docker-compose 部署clickhouse-server:24.6
本文介绍了如何使用 Docker Compose 快速部署 ClickHouse Server 24.6 单节点服务,含端口映射(8123/9000)、数据日志持久化、密码安全配置及自定义 config.xml 示例,并提供启动验证命令与生产安全提示。
Data Agent 入门训练营--第3课《如何用Data Agent 快速定位问题根源》
本次分享介绍了如何使用Data Agent做根因分析,快读定位问题根源,以排查某网站GMV下跌、某用户下单购买冰箱多渠道触点转化两个预设情景,使用Data Agent进行根因分析和归因分析,帮助企业快速定位问题根源辅助决策。
redis在云端内网,管理redis数据的方案
云端Redis默认禁外网访问,直接开放易致数据泄露(尤其弱密码场景)。推荐用yunedit-redis:通过SSH隧道安全映射内网Redis端口至本地(如16379),再连接localhost:16379,即可安全完成增删查改及导入导出。
构建 AI 数据基座:思必驰基于 Apache Doris 的海量多模态数据集管理实践
面对海量多模态数据管理困境,思必驰通过构建以 Apache Doris 为核心的数据集平台,实现了数据从“散、乱、滞”到“统、明、畅”的转变。在关键场景中,存储占用下降 80%、查询 QPS 提升至 3w,不仅实现可量化的效率提升和成本优化,更系统化地提升了 AI 研发效率与模型质量。
千锤百炼,稳如磐石:阿里云Tair无感切换技术保障业务持续在线
Tair基于15年技术沉淀,创新实现主从无感切换,通过内核、SDK与网络协同优化,大幅降低实例切换时的不可用时间至1秒内,提升业务连续性体验。
SGLang Hierarchical Sparse Attention 技术深度解析
阿里云 Tair 联合 SGLang 推出分层稀疏化框架,通过“稀疏+分层”协同优化,将 KVCache 从 GPU 显存扩展至 CPU 与远端存储,实现计算与存储效率双突破,为百万级超长上下文推理提供新路径。
阿里云数据库上云优选活动参考:RDS年付88元起!RDS/PolarDB+DAS运维服务降低运维门槛
2026年阿里云数据库上云优选活动为用户推出了多款特惠云数据库产品,RDS年付88元起;RDS PostgreSQL 基础系列标准版2核4G(通用型)227.99/1年;数据传输服务 DTS99.00/1月。本文为大家整理了阿里云数据库上云优选活动的具体内容,以供参考。
科研证实:智能体来了,智创未来科技突破效率提升 200%
AI正从“工具”进化为“智能体”,具备自主思考、拆解任务、自我修复与协作能力。多智能体系统可提升研发效率200%,未来开发者将转向设计Prompt与架构,构建高效工作流,开启智创新时代。
当智能体来了科技舞台,智创未来,重拾对未知的激情
大模型已非仅是“聪明的聊天框”,智能体(AI Agent)正赋予其行动力,实现从被动应答到主动执行的跨越。具备感知、规划、行动与记忆能力的Agent,将助开发者摆脱重复劳动,转型为系统架构师与智能体指挥官,重拾技术初心,聚焦创造性挑战。当繁琐被托付机器,人类将重返探索未知的征程,以智慧定义方向,以AI实现未来。
Data Agent 入门训练营--第2课《快速上手了解Data Agent》
本次分享介绍了Data Agent产品界面功能,演示如何快速上手完成一次数据洞察,以一份示例数据走通全流程,包括数据源录入上传、提问并启动任务后,在Agent分析过程中多轮追问、补充说明,得到文字报告后进一步绘制网页报告,查看最后的分析产物和记忆。
阿里云MongoDB数据库支撑心动公司《心动小镇》全球稳定发行
心动自研生活模拟手游《心动小镇》全球上线即火爆。面对全球数千万玩家带来的海量高频存档压力与复杂的跨国运维挑战,心动借助阿里云MongoDB强大的弹性伸缩与秒级回档能力,成功保障了全球玩家极致稳定的游戏体验。
阿里云数据库产品支持免费试用吗?最新可试用数据库规格信息、配置及可试用人群参考
2026年阿里云数据库试用活动的核心内容参考,涵盖26款可试用数据库产品,包括RDS MySQL、Tair、PolarDB、AnalyticDB等主流类型,覆盖Serverless、集群版、多模态等多种形态。活动支持个人与企业认证用户,适用场景涵盖开发测试、生产环境、AI集成、实时分析等。新用户可享免费试用额度及后续折扣。
智能体来了智创未来——人工智能技术走向智能体时代的演进与思考
人工智能正从大模型迈向智能体时代,具备感知、决策、执行闭环的AI智能体,推动技术从“能理解”到“会行动”的跃迁。通过任务规划、工具调用与系统协作,智能体正重塑软件架构与生产流程,实现从被动响应到主动执行的升级,加速智创未来落地。(238字)
Data Agent 入门训练营--第1课《Data Agent介绍》
本次分享主要介绍Data Agent产品能力,适用场景和客户案例,适合首次接触Data Agent的用户快速了解产品全貌。
AI 能力揭秘(五):Apache Doris 原生向量检索的设计及实现
随着大模型和多模态 AI 的快速发展,向量已成为文本、图像、音视频等多元数据的通用语义表示。在这种背景下,检索增强生成(RAG)技术成为连接私有知识与大模型的核心桥梁,而高效的向量检索则是其关键支柱。 与将向量检索视为独立外挂服务的方案不同,Apache Doris 4.0 选择将向量检索能力深度集成于其 MPP 分析型数据库内核。实现向量检索与 SQL 计算、实时分析和事务保障的无缝融合。 本文旨在深入剖析 Doris 向量检索的系统级设计与工程实践,展示其如何在性能、易用性与规模扩展之间取得的平衡。
阿里云数据库 RDS(MySQL、SQL Server、PostgreSQL、MariaDB) 收费标准
阿里云数据库RDS(Relational Database Service)是全托管关系型数据库服务,支持MySQL、SQL Server、PostgreSQL和MariaDB四种主流引擎,适配从轻量测试到企业核心业务的不同需求。很多用户会被不同引擎、规格、计费方式的价格差异弄混淆,下面结合最新收费信息,用通俗语言梳理各引擎价格、影响因素及选型建议,帮大家精准把控成本。
不止于云原生:阿里云PolarDB全面内化AI能力,构建AI就绪的下一代数据库架构
2026阿里云 PolarDB 开发者大会上,PolarDB 发布 AI 数据湖库(Lakebase)等全新能力,推出“AI 就绪的云原生数据库”四大支柱,推动数据库从“外挂式”集成 AI 到“内生智能”的进化,赋能 Agent 应用开发,助力企业实现智能决策与业务跃迁。
不懂向量数据库?别怕!一文讲清8大主流工具,手把手教你做选择
向量数据库是AI应用的“超级记忆中枢”,能将文本、图像等转化为数学指纹并快速检索相似内容。本文通俗解析8大主流向量数据库,涵盖托管型、开源型与嵌入式三类,助你根据场景选型,轻松构建智能搜索、推荐系统与RAG应用。
【赵渝强老师】Oracle多租户容器数据库
Oracle 12c引入多租户容器数据库(CDB),支持在一个数据库服务器上管理多个可插拔数据库(PDB),提升资源利用率,降低成本。CDB由根容器、PDB种子和多个PDB组成,可通过DBCA或SQL脚本创建,实现高效数据库整合与运维。
告别盲目试错!大模型微调核心参数的“油门、档位与里程
本文深入浅出讲解大模型微调三大核心参数:学习率、batch_size、epochs,类比“油门、档位、里程”,帮助新手理解其作用与配合逻辑。结合PyTorch实操案例,提供从基础设置到单参数优化的完整流程,并分享避坑指南与效果评估方法,助力告别盲目试错,实现高效稳定微调。
微调完怎么判断好不好?大模型效果评估入门指南(附代码)
本文详解大模型微调后如何科学评估效果,涵盖文本分类、生成与语言建模三类任务的核心指标(如F1、BLEU、ROUGE、PPL),结合Python代码实操演示,并强调需结合业务场景、微调前后对比及稳定性验证,避免“指标虚高”。附实用工具推荐,助力新手高效完成评估闭环。
不用换显卡!大模型微调显存优化实操指南(附代码+效果对比)
不用换显卡!本文详解三大显存优化技巧:梯度检查点、混合精度训练、动态批量调整,附PyTorch实操代码与效果对比。16G显卡成功微调Llama 2 7B,显存占用直降38.5%,精度几乎无损,学生党、个人开发者也能轻松上手。
90%的大模型微调失败,都栽在数据集上!从零搭建高质量数据集保姆级指南
90%的大模型微调失败源于数据集问题!本文从零拆解高质量数据集搭建全流程,涵盖需求分析、数据采集清洗、标注结构化、质量校验到格式转换7大步骤,结合美妆文案等实例,手把手教你避开常见坑。实现精准风格定制,让模型真正“学得会、用得好”。
MySQL Docker 容器化部署全指南
本文为MySQL Docker单实例生产部署规范v1.0,涵盖镜像拉取、4种部署方案(测试/单机/企业入门)、结果验证与5类常见问题解决,集成备份恢复、安全基线及HA选型建议,适配SaaS初创、中小企及私有化场景,强调数据持久化、资源限制与内网安全访问,不适用于金融级高可用场景。
一文读懂LLM微调:新手必知的原理、误区与场景化应用方案
本文深入浅出讲解LLM微调原理与实操,涵盖新手必知的核心概念、常见误区及场景化应用方案。通过类比“学霸特训”,解析微调与提示词区别,推荐轻量级LoRA方法,提供从数据准备、环境搭建到模型训练、效果评估的完整步骤,并附实用工具与避坑指南,助力AI初学者快速掌握定制化模型技能,实现个人或企业级AI应用落地。
什么是大模型微调?从原理到实操,新手也能轻松上手
本文通俗讲解大模型微调技术,从原理到实操全流程解析。通过比喻厘清CPT、SFT、DPO三种方式,指导新手如何用业务数据定制专属AI,并提供数据准备、工具选择、效果评估等落地步骤,助力个人与企业低成本实现模型私有化,让大模型真正融入实际场景。
从极速复制“死了么”APP,看AI编程时代的技术选型
本文以爆款 App“死了么”为例,讲述在AI时代如何通过 Supabase 等 BaaS 服务实现极简全栈开发。借助AI编程工具与无服务器架构,开发者可快速完成从创意到上线的全流程,降低后端复杂度,聚焦核心业务逻辑,实现低成本、高效率的 MVP 落地。
驾驭 CPU 与编译器:Apache Doris 实现极致性能的底层逻辑
Apache Doris 的演进给我们提供了一个生动的答案——它不仅跟随硬件与编译器的发展而演进,更主动地通过向量化、模板化、指令级并行与精细的用户态调度模式,将每一代 CPU 的潜力推向理论极限。
手把手教你定制专属AI:大模型微调完全指南
微调是让通用大模型适应特定领域的关键步骤,如同为通才提供专业培训。它以低成本、高效率提升模型在医疗、法律、客服等场景的专业性,通过LoRA等技术实现快速迭代。数据质量与评估并重,小团队也能打造专属AI专家。
从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验
面对日益增长的业务体量与复杂多变的分析需求,选用一个高效、可靠的数据库系统,已成为支撑业务稳健发展与快速创新的关键。Apache Doris 以其出色的性能表现与高度灵活的架构,成为众多场景下的优选方案,详情阅读原文。
大模型指南:一文搞懂LoRA微调
本文详细解析LoRA微调技术,通过低秩分解实现参数高效适配。您将了解其核心原理、实践步骤及效果评估方法,以及如何在消费级GPU上轻量化定制百亿参数大模型,并探索其未来应用与进阶技巧。
云数据库多少钱?2026年阿里云数据库 RDS 收费标准:MySQL、SQL Server 等引擎价格解析
阿里云数据库 RDS(Relational Database Service)是全托管关系型数据库服务,支持 MySQL、SQL Server、PostgreSQL 和 MariaDB 四种主流引擎,适配从轻量测试到企业核心业务的不同需求。很多用户会被不同引擎、规格、计费方式的价格差异弄混淆,下面结合最新收费信息,用通俗语言梳理各引擎价格、影响因素及选型建议,帮大家精准把控成本。
静态 IP 维护:如何清闲置提效率?
静态IP管理需科学规划、规范配置、动态维护与安全防护并重,通过合理划分子网、建立地址台账、定期巡检回收及强化访问控制,有效避免地址冲突与安全风险,保障网络稳定高效运行。
基于 Docker 的 MongoDB 部署与使用指南
本指南面向不同层级开发者,详解 MongoDB 6.0 + Docker 部署:从单节点开发环境到高可用副本集生产部署,涵盖初始化、备份恢复、安全认证、监控告警及常见问题排查,助力高效构建稳定可靠的 MongoDB 服务。
实战教程:使用API获取日本股市前100支股票数据
本教程教你使用API实时获取日本股市前100支股票数据,涵盖环境配置、接口调用、数据处理与可视化。通过Python实战构建股票监控系统,掌握金融数据分析核心技能,助力量化交易与投资决策。
【赵渝强老师】OceanBase的配置文件与配置项
OceanBase集群中,OBServer节点需预创建etc、log、run、store等目录,store下还需clog、slog、sstable子目录。etc存放配置文件,etc2/3为自动备份目录,配置项分集群与租户级,通过SHOW PARAMETERS查看,支持模糊查询。
数据库
数据库领域前沿技术分享与交流