阿里云消息队列 Kafka 商业化首发 | 进一步提升 Kafka 在大数据生态中的价值

简介:

7月25日,阿里云即将直播发布消息队列Kafka,全面融合开源生态。

【直播传送门】

在全面兼容Apache Kafka生态的基础上,消息队列Kafka还具备了超易用,超高可用可靠性,扩缩容不操心,全方位安全诊断,数据安全有保障的特点。可用行达99.9%,数据可靠行99.999999%,彻底解决Apache Kafka稳定性不足的长期痛点,并且支持消息无缝迁移到云上。

_Kafka_3


» 全面兼容Apache Kafka生态

Apache Kafka是一个高吞吐的分布式,具备冗余备份的持久性化消息产品。正因为Apache Kafka为了分布式大数据而生,Apache Kafka 具有丰富的应用生态,主要包括以下三个方面:

  • 广泛应用于大数据领域,如网站行为分析、日志聚合、Apps监控、流式数据处理、在线和离线分析等;
  • 让数据集成变得简单:您能将 Kafka 中的消息导入到 ODPS、HBase、HBASE 等离线数据仓库;
  • 可广泛的与流计算引擎集成,包括阿里云平台的 StreamCompute、E-MapReduce 和开源产品 Spark、Storm 等;
  • 消息队列 Kafka 全面兼容Apache Kafka生态的基础上,还具备了超易用,超高可用可靠性,扩缩容不操心,全方位安全诊断,数据安全有保障的特点。

_Kafka_1


» 无缝迁移,自建无缝迁移到云上商业版

从自建 Kafka 到消息队列 Kafka,支持开源产品的无缝迁移,提供无门槛接入方式。那么消息队列 Kafka是如何做到让用户无缝迁移的呢?消息队列 Kafka 100% 兼容开源社区Apache Kafka(0.10.0.0 及以上版本),直接使用Kafka开源客户端便可与阿里云上消息队列Kafka进行通讯;对于原本使用开源 Apache Kafka的用户无需任何改造,即可迁移上云,享受到阿里云提供的消息队列 Kafka 服务;同时消息队列 Kafka 支持开源社区、阿里云平台产品的打通,与Kafka全生态能快速对接。


» 全托管服务,专业团队运维,客户0运维成本

Kafka团队提供专业的托管服务,用户无需关心各种运维细节。Kafka团队会从巡检 + 监控 + 告警三方面去保驾护航:

  • 提供HouseKeeping(健康巡检组件):自动在Kafka 核心链路的运行时巡检,每分钟会对集群做一次全面扫描诊断,并能针对不健康的状态进行告警,同时,每日出具整体巡检报告,方便运维人员每天观察 Kafka 系统的健康状态;
  • 业务监控与告警:每个 Consumer Group 都可以根据消息的堆积量情况进行监控与告警设置,帮助用户及时发现问题;
  • Open APIKafka 提供给用户的一整套完备的管控类 Open API,用于实现一系列资源管理和运维功能。

» 稳定安全,可用行达99.9%,数据可靠行99.999999%

优化开源Apache Kafka长期的痛点。支持海量消息堆积,在海量消息堆积的情况下,始终保持 Kafka 集群的消息收、发的高吞吐能力服务可用性达 99.9%;消息会持久化落盘到消息队列,在磁盘容量足够的情况下,未到期数据保障存储,数据可靠性达到 99.999999%。

支持阿里云 VPC 访问;支持权限控制,以消息主题(Topic)、订阅组(Consumer Group)的粒度对用户访问权限进行控制,对每一条消息(Message)的收、发都进行严格的访问控制,确保消息的安全性;访问安全,在非VPC环境下使用,基于阿里云账号体系,并利用 SSL 对通道进行加密传输,确保数据传输过程中不被窃取或篡改,保证客户数据的安全。

历经近10年的技术沉淀,阿里巴巴将企业互联网化的精华沉淀在Aliware上,后者支撑了99%以上的大规模应用,目前阿里云推出了企业级分布式应用服务EDAS、性能测试PTS、消息队列MQ等近10款Aliware产品,为政府央企、智能制造、新零售等众多领域领先企业提供了领先的PaaS云产品,消息队列Kafka的推出将为更多长期使用Apache Kafka的开发者带来更多便利。

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 分布式计算
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
117 35
|
1月前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
2月前
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
69 4
|
2月前
|
存储 人工智能 数据管理
|
2月前
|
SQL 存储 分布式计算
阿里云 Paimon + MaxCompute 极速体验
Paimon 和 MaxCompute 的对接经历了长期优化,解决了以往性能不足的问题。通过半年紧密合作,双方团队专门提升了 Paimon 在 MaxCompute 上的读写性能。主要改进包括:采用 Arrow 接口减少数据转换开销,内置 Paimon SDK 提升启动速度,实现原生读写能力,减少中间拷贝与转换,显著降低 CPU 开销与延迟。经过双十一实战验证,Paimon 表的读写速度已接近 MaxCompute 内表,远超传统外表。欢迎体验!
|
2月前
|
SQL DataWorks 数据可视化
阿里云DataWorks评测:大数据开发治理平台的卓越表现
阿里云DataWorks是一款集数据集成、开发、分析与管理于一体的大数据平台,支持多种数据源无缝整合,提供可视化ETL工具和灵活的任务调度机制。其内置的安全体系和丰富的插件生态,确保了数据处理的高效性和安全性。通过实际测试,DataWorks展现了强大的计算能力和稳定性,适用于中小企业快速搭建稳定高效的BI系统。未来,DataWorks将继续优化功能,降低使用门槛,并推出更多灵活的定价方案,助力企业实现数据价值最大化。
|
2月前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
116 2
|
3月前
|
存储 分布式计算 大数据
【赵渝强老师】阿里云大数据生态圈体系
阿里云大数据计算服务MaxCompute(原ODPS)提供大规模数据存储与计算,支持离线批处理。针对实时计算需求,阿里云推出Flink版。此外,阿里云还提供数据存储服务如OSS、Table Store、RDS和DRDS,以及数据分析平台DataWorks、Quick BI和机器学习平台PAI,构建全面的大数据生态系统。
112 18
|
3月前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
222 19
|
3月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。

相关产品

  • 云消息队列 Kafka 版