分布式计算的搜索结果_第4页-阿里云开发者社区

QuickBI产品小助手

|

27天前

|

博文

Quick BI使用案例29：MaxCompute含JSON字段表同步失败解决方案

本文介绍MaxCompute表含JSON字段导致Quick BI元数据同步失败的原因原因（Quick BI暂不支持JSON类型）及三步解决方案——DataWorks中将JSON改为STRING、Quick BI重新同步、验证表可见性，助您高效用好产品。

# JSON # 分布式计算 # BI # MaxCompute # 数据格式

游客jc7wx7wwpv5sk

|

27天前

|

博文

从多平台回答样本到一致性结果：数据清洗与指标聚合流程

本文介绍面向多平台AI回答的一致性分析数据工程方案：通过DataWorks+MaxCompute实现采集、清洗、别名归一、解释抽取、差异标签生成与指标聚合六大环节，支持豆包、通义千问等平台的实体提及、推荐及解释充分度横向对比，保障全链路可追溯与质量可控。

# 数据采集 # 人工智能 # 分布式计算 # DataWorks # MaxCompute

游客jc7wx7wwpv5sk

|

30天前

|

博文

从多品牌回答样本到竞品对比结果：数据清洗与指标聚合流程

本文介绍了一套面向多品牌AI竞品对比的数据工程方案，涵盖采集、清洗、别名归一化、提及/推荐识别、差异标签生成与指标聚合六大环节，基于阿里云DataWorks+MaxCompute构建可追溯、可配置、可扩展的自动化处理流程，助力从非结构化AI回答中高效产出结构化竞品分析结果。

# 数据采集 # 人工智能 # 分布式计算 # DataWorks # MaxCompute

游客wp377xfxa7gym

|

30天前

|

博文

2026大型企业怎么做数据治理？落地指南与国内厂商推荐

2026年，中国企业数据治理核心痛点是“如何治理”而非“如何获取”。本文深度解析瓴羊Dataphin——源自阿里OneData方法论、经EB级实战验证的智能治理平台。它破解标准缺失、质量滞后、血缘不清、安全与价值失衡四大难题，以全链路智能治理、DataAgent资产智能体、多云开放架构及可口可乐、财通证券等标杆案例，助力企业真正实现数据资产化与业务赋能。（239字）

# 数据采集 # 人工智能 # 分布式计算 # 安全 # BI

云小子来社区

|

30天前

|

博文

|

来自：弹性计算

阿里云服务器实例规格怎么选？通用型、计算型、内存型、通用算力型等热门实例选型参考

阿里云ECS提供通用型（g系列）、计算型（c系列）、内存型（r系列）、通用算力型（u实例）和大数据型（d系列）五大实例规格，满足不同业务需求。g系列资源均衡，适用于Web应用、数据库等大多数场景；c系列CPU性能强，适合HPC、游戏服务器；r系列内存配比高达1:8，专为Redis、SAP HANA等内存数据库设计；u实例性价比突出，适合中小企业官网及开发测试；d系列配备大容量本地NVMe盘，面向Hadoop、Spark等大数据处理。选型时需根据预装软件、计算/内存/网络需求及存储特性综合匹配，如负载均衡选c系列、缓存选r系列、大数据选d系列，确保性能与成本最优平衡。

# 存储 # 弹性计算 # 分布式计算 # 固态存储 # 数据库

游客jc7wx7wwpv5sk

|

1月前

|

博文

从公开网页到品牌知识字段：数据清洗与证据源管理

本文介绍从公开网页构建结构化品牌知识库的数据工程实践，涵盖采集、解析、字段抽取、别名合并、证据溯源与质量校验五大环节，强调可追溯、可复核、有时效的AI知识供给能力，并基于阿里云DataWorks+MaxCompute提供落地方案。

# 数据采集 # 人工智能 # 分布式计算 # DataWorks # MaxCompute

游客jc7wx7wwpv5sk

|

1月前

|

博文

从AI回答样本到品牌诊断结果：数据清洗与归因流程

本文介绍基于DataWorks+MaxCompute的品牌AI诊断数据工程方案，覆盖采集、清洗、品牌归一化、语义分析、异常标签生成与多维归因分析六阶段，解决别名识别难、异常判定模糊、归因不可溯等核心挑战，实现可追溯、可复核的结构化诊断。

# 数据采集 # 人工智能 # 分布式计算 # DataWorks # MaxCompute

Echo_Wish

|

1月前

|

博文

|

来自：大数据与机器学习

别再把 OLAP 和 SQL-on-Hadoop 搞混了！都是查数据，它们根本不是一回事

# SQL # 分布式计算 # OLAP # BI # HIVE

游客jc7wx7wwpv5sk

|

2月前

|

博文

品牌别名、解释文本和场景标签：AI回答数据清洗实践

本文分享AI回答数据清洗的实战方法，聚焦品牌别名归一、解释文本抽取、场景标签分类等五大环节，基于DataWorks+MaxCompute实现从非结构化回答到可量化指标（提及率、解释充分度等）的端到端落地，强调可追溯、可复用、可持续维护。

# 数据采集 # 人工智能 # 分布式计算 # MaxCompute # C++

weigeshuoyun

|

2月前

|

博文

阿里云E-MapReduce（开源大数据平台）从零到一对接使用完全指南

本文是一份面向实战的阿里云E-MapReduce（EMR）对接使用完全指南。文章从EMR的三种产品形态入手，系统讲解了使用前的账号授权与网络规划、控制台创建集群的关键配置项、多种数据源（OSS、Tablestore、RDS等）的对接方式、Spark SQL与Flink任务的开发示例、RAM权限管理体系、集群监控告警配置，以及计算与存储分离架构下的成本优化最佳实践。全文包含完整的代码示例和配置参数说明，帮助读者从零开始掌握EMR的核心使用技能，快速搭建企业级大数据处理平台。

# 存储 # 弹性计算 # 分布式计算 # 对象存储 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算