分布式计算

首页 标签 分布式计算
# 分布式计算 #
关注
37750内容
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容,并通过互联网广告和物流行业案例分析,展示其实际应用。具有专业性、可操作性和参考价值。
|
5月前
|
LLM用于科学假设生成:探索与挑战
产生新颖的科学假设和科研方向,是科学发现的重要前提;大语言模型生成科学假设已有不少探索,但仍面临诸多挑战
立马耀:通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统,驱动个性化推荐业务
蝉妈妈旗下蝉选通过迁移到阿里云 Serverless Spark 及 Milvus,解决传统架构性能瓶颈与运维复杂性问题。新方案实现离线任务耗时减少40%、失败率降80%,Milvus 向量检索成本降低75%,支持更大规模数据处理,查询响应提速。
鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求,采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升,支持业务快速发展、计算效率提升,增强SLA保障,稳定性提升,降低运维成本,并支撑全球化数据架构部署。
DMS+X:GenAI 时代的一站式 Data+AI 平台
在AI技术快速发展的背景下,阿里云DMS + X平台应运而生,通过OneMeta和OneOps两大创新,提供统一元数据服务及一体化Data + AI开发环境。文章详细介绍了DMS + X在数据治理、开发提效及实际案例中的应用,助力企业在GenAI时代实现数字化转型。
|
5月前
|
阿里Dataphin评测
作为一名后端开发工程师,我通过体验阿里巴巴的Dataphin对数据治理有了更深理解。Dataphin基于OneData方法论,提供一站式数据采集、建模、管理与分析能力,助力企业高效处理海量数据并支持业务决策。在实际操作中,我完成了项目创建、离线管道任务开发、SQL计算任务、数据补充及即席分析等功能体验,感受到其强大的数据处理能力和便捷性。不过,在大体量数据查询时性能稍显不足,且对非主流数据源支持有限。总体而言,Dataphin是一款功能全面的数据治理工具,适合企业数字化转型需求,未来潜力巨大。
免费试用