Jim Dowling在Spark Summit 2017上做了主题为《Structured Spark Streaming-as-a-Service with Hopsworks》的演讲,就spark-streaming的自动服务等进行了深入的分享。
https://yq.aliyun.com/download/607?spm=a2c4e.11154804.0.0.539d6a796Xu99r
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
Jim Dowling在Spark Summit 2017上的演讲《Structured Spark Streaming-as-a-Service with Hopsworks》深入探讨了Spark Streaming的自动化服务方面。虽然提供的知识库资料未直接包含该演讲内容,但我们可以从相关参考资料中概括出Structured Streaming在实践中的应用方式,这些实践与Dowling演讲的主题精神相契合。
数据源接入:
spark.readStream.format("loghub")
读取阿里云LogService数据,需配置endpoint、AccessKey、Secret等参数。.format("datahub")
消费阿里云DataHub数据,同样需要设置AccessKey、endpoint、project、topic等信息,并支持自定义数据处理逻辑。数据处理:
groupBy().count()
),实现复杂的数据处理逻辑。结果输出(Sink):
.writeStream.format("console").outputMode("complete")
完成输出配置。执行与管理:
综上所述,尽管没有直接引用Jim Dowling演讲的具体内容,但从上述实践案例可以看出Structured Spark Streaming致力于提供一种服务化的流处理体验,这与他在Spark Summit 2017上分享的主题方向相符,即通过高度抽象的API和服务化设计,使开发者能够更高效地构建和管理实时数据处理应用。