使用容器和Elasticsearch集群对Twitter进行监控

简介:

介绍


Elasticsearch是ELK(Elasticsearch/Logstash/Kibana)的基石。在这篇文章中,我们将使用Rancher Catalog来部署stack,并将它用于追踪Twitter上的tag和brand。


追踪Twitter上的hashtag对于衡量基于Twitter的营销活动的影响力是非常有用的。你可以从中提取出诸如您的推文被转发的次数,你的营销活动为你带来了多少位新的关注者等有效信息。


安装ELK stack


Elasticsearch


若你已经有了一个正在工作中的Elasticsearch集群,现在只需要调整一些集群中的配置即可。我们将使用JSON创建一个索引模板,来调整相关配置。


  • GitHub上获取JSON模板

  • 在你的浏览器中输入http://[你的kopf在rancher主机上的路径]

  • 在kopf中,点击“more”,然后在下拉菜单中选择“index templates”


wKiom1kTKRjhKxFJAACWV6zk2fQ808.jpg


现在我们给我们的索引模板起个名字,并且推动其配置。


  • 使用twitter_elk_example作为模板名称

  • 粘贴你之前下载的JSON文件中的内容

  • 点击“save”按钮


wKiom1kTKS6Sc-zHAACZEPVSHl0935.jpg


Elasticsearch集群的配置就到这里。现在让我们接着往下走。


Logstash


Logstash让你能够分析所获得的数据并且将数据传输至你的Elasticsearch集群中。它原生支持很多数据源(如Twitter APIs、collectd、Apache日志等)。


在处理你的数据时,Logstash可以帮助你解压或格式化你数据中的正确部分。这样,你就不必推送一些不必要的或者(更糟的)错误数据,这些脏数据会使你的Kibana dashboard与实际情况不相符。


在我们开始之前,需要创建Twitter应用密钥


需要特别关注以下内容:


  • Consumer Key

  • Consumer Secret

  • Access Token

  • Access Token Secret


注意:确保你所有的Rancher主机的时钟均已同步,否则你将无法正确地使用Twitter证书。


现在跳转到目录页并选择Logstash(最好是最新的版本)。你需要在“Logstash inputs*”输入框中加入以下内容(用你自己的APIs认证密钥替换CAP文本):

1
2
3
4
5
6
7
8
twitter {
  consumer_key =>  "INSERT YOUR CONSUMER KEY"
  consumer_secret =>  "INSERT YOUR CONSUMER SECRET"
  oauth_token =>  "INSERT YOUR ACCESS TOKEN"
  oauth_token_secret =>  "INSERT YOUR ACCESS TOKEN SECRET"
  keywords => [  "docker" "rancher_labs" "rancher" "kubernetes"  ]
  full_tweet =>  true
  }

注意:在关键字数组中,不要使用“@”或者“#”符号,否则Logstash将运行失败并报“unauthorized message”错误。

1
2
3
4
5
6
7
8
9
在“Logstash output*”这个输入框中,你需要加入以下内容
output {
  elasticsearch {
  host =>  "elasticsearch:9200"
  protocol =>  "http"
  cluster_name =>  "NAME OF YOUR ELASTICSEARCH CLUSTER"
  index =>  "twitter_elk_example"
  document_type =>  "tweets"
  }

wKiom1kTKV6zZR7dAABueZVzZ1M238.jpg


最后,选择“elasticsearch-clients as the Elasticsearch stack/service”,点击“launch”按钮即可!


wKioL1kTKWqDJWX5AAAwWH2y8ws290.jpg


接下来的事情Rancher将会帮你做完,包括部署一个完全配置好的Logstash。如果一切顺利,在几分钟之内,你应该能看到数据已经被加入到了你的Elasticsearch主页中。你可以在http://[你的ElasticSearch主机地址]/#kopt 中查看。


wKiom1kTKXfh_XM1AAAOMVOCsRs488.jpg


Kibana


Kibana能帮助你根据Elasticsearch集群中的数据创建一个强大的dashboard。要部署Kibana,你只需要做两件事情:选择正确的Rancher Catalog版本,然后将它连接到elasticsearch-clients容器中。


wKioL1kTKYrRx_U_AABB_5hXbbU709.jpg


这样,一个配置正确的Kibana已经准备好被使用了!后续我们还将会对它进行一些配置。


现在,整个ELK栈就部署好了。虽然Elasticsearch和Logstash已经部署好了,我们还是需要对Kibana进行一些操作。


在这个例子中,我们只需要在Kibana中导入一个JSON仪表盘即可。


  • 点击这里获取JSON文件

  • 进入Settings –> Object,然后点击“import”,接下来选择刚刚下载好的文件。你应该会看到类似于下图的界面。


wKioL1kTKabTTd_AAABiQUgAro0835.jpg


剩下的就是在Kibana中创建一个适当的索引设置了。


前往“Indices”页面,然后点击“New”按钮。你应该能看到被创建好的索引和被选择了的@timestamp(时间戳)。


wKiom1kTKbWAWNkiAACEEqM8XAk702.jpg


到目前位置,你已经有了一个帮助你监控Twitter上的hashtag和brand的Kibana dashboard。要加载被导入的dashboard,你只需要在这里点击它的名字即可。


wKioL1kTKcTzhFnuAAAc_3cW-2U070.jpg


几分钟后,重新查看dashboard,你会看到类似下图的界面:


wKioL1kTKduACaNQAACi300xW2E339.jpg


至此,你就能成功监测Twitter上的tag和brand的情况啦! 


本文转自 RancherLabs 51CTO博客,原文链接:http://blog.51cto.com/12462495/1924347

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
6月前
|
NoSQL 算法 Redis
【Docker】(3)学习Docker中 镜像与容器数据卷、映射关系!手把手带你安装 MySql主从同步 和 Redis三主三从集群!并且进行主从切换与扩容操作,还有分析 哈希分区 等知识点!
Union文件系统(UnionFS)是一种**分层、轻量级并且高性能的文件系统**,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem) Union 文件系统是 Docker 镜像的基础。 镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
722 6
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
2523 1
|
12月前
|
Java Linux
CentOS环境搭建Elasticsearch集群
至此,您已成功在CentOS环境下搭建了Elasticsearch集群。通过以上介绍和步骤,相信您对部署Elasticsearch集群有了充分的了解。最后祝您在使用Elasticsearch集群的过程中顺利开展工作!
582 22
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
人工智能 Prometheus 监控
容器化AI模型的监控与治理:确保模型持续稳定运行
在前几篇文章中,我们探讨了AI模型的容器化部署及构建容器化机器学习流水线。然而,将模型部署到生产环境只是第一步,更重要的是确保其持续稳定运行并保持性能。为此,必须关注容器化AI模型的监控与治理。 监控和治理至关重要,因为AI模型在生产环境中面临数据漂移、概念漂移、模型退化和安全风险等挑战。全面的监控涵盖模型性能、数据质量、解释性、安全性和版本管理等方面。使用Prometheus和Grafana可有效监控性能指标,而遵循模型治理最佳实践(如建立治理框架、定期评估、持续改进和加强安全)则能进一步提升模型的可信度和可靠性。总之,容器化AI模型的监控与治理是确保其长期稳定运行的关键。
|
缓存 监控 Java
Elasticsearch集群JVM调优
Elasticsearch集群JVM调优
533 5
|
缓存 监控 安全
优化Elasticsearch 集群配置
优化Elasticsearch 集群配置
419 4