为常

2024-08-27

面向AI场景的数据处理和数据检索

本文分享了AI场景下面临的数据处理与检索挑战及解决方案。AI内容生产涉及数据准备、模型训练、推理及应用四大环节，其中数据准备环节面临数据来源复杂、格式多样及数据量激增的挑战，模型训练环节需解决推理准确性问题，AI应用环节则需克服接口兼容性难题。为应对这些挑战，阿里云存储OSS与智能媒体管理IMM提供百余种数据处理能力，并升级数据索引功能支持向量检索，助力构建多模态检索应用。此外，还介绍了Serverless数据处理方案，可日均处理百亿级别文件，通过OSS数据索引能力，客户能快速构建RAG检索增强，同时实现多模态检索的搭建，显著提升AI应用的效能和用户体验。

为常

109

德歌

2024-05-15

261

基于阿里云RDS PostgreSQL打造实时用户画像推荐系统（varbitx）)

用户画像在市场营销的应用重建中非常常见，已经不是什么新鲜的东西，比较流行的解决方案是给用户贴标签，根据标签的组合，圈出需要的用户。通常画像系统会用到宽表，以及分布式的系统。宽表的作用是存储标签，例如每列代表一个标签。但实际上这种设计不一定是最优或唯一的设计，本文将以PostgreSQL数据库为基础，给大家讲解一下更加另类的设计思路，并且看看效率如何。

德歌

261

言澈

2024-05-15

406

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分，主要介绍ASM Istio模式下，数据面链路的转转发链路。

言澈

406

阿里云实时数仓Hologres

2024-06-18

1095

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

1,095

阿里云存储

2024-07-16

19529

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

19,529

休祯

2024-07-18

7600

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,600

易霏夏花

2024-08-16

7351

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

PolarDB-X 分布式数据库，采用集中式和分布式一体化的架构，为了能够灵活应对混合负载业务，作为数据存储的 Data Node 节点采用了多种数据结构，其中使用行存的结构来提供在线事务处理能力，作为 100% 兼容 MySQL 生态的数据库，DN 在 InnoDB 的存储结构基础上，进行了深度优化，大幅提高了数据访问的效率。

易霏夏花

7,351

阿里云云原生

2024-08-21

601

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

601

玄飏

2024-07-04

36641

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

36,641

类目筛选

内容类型