开发者社区问答正文

实时计算助力协鑫光伏实现工业4.0

数据研发专家戢洋（实修）在2017杭州云栖大会中做了题为《实时计算助力协鑫光伏实现工业4.0》的分享,就客户的基本需求：构建大数据平台，公共云环境架构方案和技术方案做了深入的分析。

https://yq.aliyun.com/download/1819?spm=a2c4e.11154804.0.0.74816a79koBxMm

展开

收起

福利达人 2018-07-16 22:13:11 977 版权

阿里云 AI 助理回答

针对戢洋在2017杭州云栖大会分享的《实时计算助力协鑫光伏实现工业4.0》中提及的客户需求——构建大数据平台，特别是在公共云环境下的架构方案和技术方案，我们可以提炼出以下关键点和建议：

构建大数据平台的公共云环境架构方案

1. 技术选型与服务集成

数据处理引擎：采用Apache Spark作为核心数据处理框架，因其在大规模数据处理、实时分析及机器学习领域的高效表现。通过Spark连接DLF（Data Lake Formation）能力，可以无缝对接阿里云上的数据湖服务，实现数据的统一管理和分析。
实时计算：利用阿里云实时计算Flink版来支持流式数据处理需求，确保数据处理的低延迟和高吞吐量，符合工业4.0对实时决策的需求。

2. 本地开发与调试

Spark本地调试：在进行Spark应用开发时，可以通过配置local[4]模式快速搭建本地调试环境。确保能够顺利创建数据库、表以及执行基本的SQL操作，如数据插入、查询等，为后续部署到云端打下基础。
连接器配置：对于包含特定连接器的Flink作业，在IntelliJ IDEA中进行本地运行和调试时，需注意解决类找不到的问题。通过添加包含所有必要类的uber JAR包至pipeline.classpaths配置中，以确保依赖完整。

3. 云上资源准备与部署

基础设施：选择合适的阿里云ECS（Elastic Compute Service）实例作为计算节点，并根据业务规模配置VPC网络、安全组规则，确保数据传输的安全性和效率。
存储服务：使用OSS（Object Storage Service）存储海量数据，同时考虑使用DLF管理元数据和访问控制，提升数据治理能力。
数据仓库：结合MaxCompute（原ODPS）作为大数据分析平台，提供PB级数据处理能力，支撑复杂的数据分析任务。

4. 安全与合规

确保遵循行业标准和法规要求，实施身份认证、访问控制策略，加密传输和静态数据加密，利用阿里云提供的安全产品和服务强化系统安全性。

5. 性能优化与监控

利用阿里云监控服务监控应用性能，根据负载情况动态调整资源分配，确保成本效益最大化。
对于Spark和Flink作业，合理配置资源、优化作业参数，以达到最佳性能。

结论

构建基于公共云的大数据平台，应综合考虑技术栈的选择、本地开发便利性、云上资源的高效利用、安全合规性以及性能优化策略。通过集成阿里云的系列服务，如Spark、Flink、OSS、MaxCompute等，可有效助力企业实现工业4.0转型，提升数据分析处理能力，加速业务决策过程。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

大数据云栖大会流计算实时计算 Flink版云原生大数据计算服务 MaxCompute

问答标签：

实时计算 Flink版协鑫光伏工业

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料