Spark与elasticsearch结合使用是一种常用的场景,小编在这里整理了一些Spark与ES结合使用的方法。 一、 write data to elasticsearch 利用elasticsearch Hadoop可以将任何的RDD保存到Elasticsearch,不过有个前提其内容可以翻译成文件。这意味着RDD需要一个Map/JavaBean/Scala case class Scala 在Scala中只需要以下几步:
Spark Scala imports
Elasticsearch-hadoop Scala imports
Start Spark through its Scala API
makeRDD
index content(内容索引) index ES under spark/docs 下面是一个例子: