Confluence 6 高级性能诊断

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 请在你的系统服务请求中包括下面所有的信息,如果可能的话,你也可以在请求中包括你认为最有可能出现的问题。这样的话,可以避免我们进一步对你系统的问题进行询问。

请在你的系统服务请求中包括下面所有的信息,如果可能的话,你也可以在请求中包括你认为最有可能出现的问题。这样的话,可以避免我们进一步对你系统的问题进行询问。

系统信息

Confluence 服务器

  • 你系统信息的屏幕截图 Confluence's Administration → System Information (或者将页面保存为 HTML 文件)
  • 系统缓存状态的屏幕截图 Confluence's Administration → Cache Statistics (或者将页面保存为 HTML 文件)
  • 找到你 Confluence 运行服务器的硬件配置信息
    • 有几个 CPUs?CPU 的型号是什么,有多少 MHz?
    • 你的服务器上装了多少内存?
    • 在 Confluence 的 JVM 使用了多少服务器的内存?(例如在 JVM 中 -Xmx 和 -Xms 的设置)
    • 在同样的服务器上,你还运行了一些其他的什么服务?

Confluence 内容

  • 在你的 Confluence 中有多少注册用户?
  • 在通常的情况下,你的用户会属于多少用户组?
  • 在你的 Confluence 服务器中有多少空间(全局和个人用户)?
  • 平均来说对一个用户可以查看到多少空间?
  • 在i的 Confluence 中有多少页面(你可以在你的数据库中执行下面的 SQL 来进行查看:'select count(*) from content where prevver is null and contenttype = 'PAGE'
  • 在 Bandana  中存储了多少数据(通常被插件来使用存储数据)?(你可以在你的数据库中执行下面的 SQL 来进行查看:'select count(*), sum(length(bandanavalue)) from bandana')

数据库

  • 你 Confluence 服务器使用的数据库的版本?
  • 你 Confluence 访问数据库服务器使用的 JDBC 版本?(针对一些数据库,数据库驱动的 JRA 中中版本的版本号)
  • 你的数据库与 Confluence 服务器是否在同一个服务器上?
  • 如果数据库服务器和 Confluence 服务器在不同的服务器上,那么网络配置是怎么样的?
  • 有关数据库连接细节是什么?数据库的连接池有多大?如果你使用的是标准配置,你可以在 _cfg.xml 文件中找到这个配置信息。如果你使用的是数据源信息,那么这个信息将会存储在你应用服务器上的配置文件中。请获得这些配置信息。

用户管理

  • 你当前正在使用的用户管理或授权?(例如,Jira 或者 LDAP 用户目录或者单点登录)
  • 如果你使用的是外部 JIRA 用户管理,那么在 Confluence 和 JIRA 之间的数据库是如何进行配置的?
  • 如果你使用的是 LDAP 管理:
    • 有关 LDAP 服务器的版本是什么?
    • LDAP 服务器和你的 Confluence 应用之间的配置是什么样的?

诊断

观察到的问题

  • 那个页面存在载入缓慢?
    • 如果是一个特定的 WIKI 页面,请将这个 WIKI 页面中的源代码也同时提交
  • 这个页面总是载入缓慢还是偶尔载入缓慢?

监控数据

在进入发现一个单独的问题的时候,对理解多个性能问题会有所帮助。我们将会处理突然的的高负载,或者缓慢增加的负载,或者有可能是某一种特定情况下的负载情况(每天,每周,甚至每个月),这些请求的增加将会对系统性能造成多大的影响?对系统进行一些持续的监控将有助于你对系统的负载情况进行更多的了解。

下面是一些有关 confluence.atlassian.com 系统的负载情况,显示如下

负载
这个图片显示了连续 2 天中的系统负载情况。这个图片显示了正常的系统负载,这个负载的产生通常是因为用户的活动而产生的,这个没有显示出系统目前没有遇到主要的问题。

增加数据库连接的线程


Java 活动线程数量

有 2 个图片将会显示应用服务器中线程活动数量(第一个图片)和数据库中连接池的大小(第二个图片)。你可以看到突然的系统线程增加将会导致数据库服务器的连接的增加。


数据库连接池大小

数据库连接池的最高值已经超过了 112。这个已经超过了默认的数据库的连接配置(100)。当这个情况出现时候,你在使用 Confluence 的时候出现一些访问的缓慢就不奇怪了。一些用户可能会遇到系统崩溃的信息,因为一些用户的请求不能获得数据库连接。

我们可以通过这些图片很容易的找到我们系统配置的一些问题。这些问题不是非常重要的问题,因为你可以通过简单的增加数据库连接来解决。

我们对 Confluence 进行一些持续的监控(我们使用 Hyperic),如果你在遇到问题的时候能够同时发送你系统的一些监控信息,这个将更有助于帮我们找到你的问题。

访问日志

  • How to Enable User Access Logging,包括有了如何将日志导出为一个独立文件的相关信息。
    • 你可以将这些对这些文件进行分析,例如 AWStats,或者手动查看那些页面在载入的时候存在载入缓慢。

属性和日志

  • 启用 Confluence 的自带的属性和性能分析,请参考页面 Troubleshooting Slow Performance Using Page Request Profiling 中的内容。
    • 如果只是一个单一的页面相应缓慢,你应该对这个页面进行一系列的请求
    • 如果性能问题是间歇性的出现,或者只是直观的感觉到了系统相应缓慢,你可以使性能监控功能保留监控 30 分钟到一个小时来获得更多有关的信息。
  • 找到 Confluence 的标准输出日志(在日志中将会保留上面的数据)。将整个日志目录进行压缩。
  • 在系统出现反应缓慢的时候进行 Take a thread dump

CPU 负载

  • 如果你遇到了 CPU 的负载率很高的话,请 install the YourKit profile 然后将 CPU 进行监控的时候附加上 2 个 profiler 的导出。如果 CPU 的查看足够长的话,请间歇 30 到 60 秒进行 profiles。最通常的的 CPU spikes 应该是操作系统的虚拟机。
  • 如果 CPU 的使用率高达 100%,请尝试使用 Live Monitoring Using the JMX Interface,在一些情况下也可以使用 Top threads plugin

站点指标和脚本

  • 对你安装实例了解用户的访问和使用也是非常重要的。请使用 Access Log Scripts 和 sql scripts 来为你的示例创建状态情况。

下一步

在 https://support.atlassian.com 中打开问题提交请求,然后将你收集的所有数据添加到你需要的请求中。这个将会给我们对你系统进行诊断所需要的足够信息,我们可以根据你提交的信息对你的系统性能进行诊断。当你创建完成问题后,请对你创建的问题进行跟踪。

 

https://www.cwiki.us/display/CONF6ZH/Requesting+Performance+Support

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
SQL 安全 前端开发
详解开源数据库审计平台Yearning
详解开源数据库审计平台Yearning
11060 2
|
7月前
|
监控 关系型数据库 MySQL
初体验:数据库监控、管理和可观测性工具(PMM)
Percona Monitoring and Management (PMM) 是一个开源工具,用于监控MySQL、PostgreSQL和MongoDB的性能。它提供实时监控、数据可视化、故障排除和管理功能,支持本地和云端数据库。要安装PMM,首先需安装Docker,然后通过提供的脚本部署PMM服务器和客户端。在MySQL服务器上创建PMM用户后,使用`pmm-admin`命令添加数据库。访问PMM的HTTPS网址(默认用户名和密码为admin)进行配置。本文还包含了安装Docker和PMM的命令行步骤。
初体验:数据库监控、管理和可观测性工具(PMM)
|
监控 API
一个获取阿里云ASO上监控数据的脚本
一个获取阿里云ASO上监控数据的脚本
482 1
|
SQL 关系型数据库 MySQL
Archery 系统配置 SQL优化审核平台配置【详解】
Archery 系统配置 SQL优化审核平台配置【详解】
|
SQL 关系型数据库 Linux
【PostgreSQL】入门学习笔记(包括安装、环境与参数配置、故障排查以及备份还原等)
以下内容为前几天在备考PostgreSQL入门考试时候做的笔记,经过了全职的两天的奋战与实验,并最终顺利通过了PCA初级认证考试。现在把我学习的笔记分享给大家,文中有对应的思维导图图片可供查看,内容与后面正文文本一致。另外,由于SQL语句部分比较基础,基本上会一门数据库就都会,所以此处部分省略掉不做过多记录了。
373 0
【PostgreSQL】入门学习笔记(包括安装、环境与参数配置、故障排查以及备份还原等)
|
关系型数据库 数据库 PostgreSQL
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 24 章 日常数据库维护工作_24.3. 日志文件维护
24.3. 日志文件维护 把数据库服务器的日志输出保存在一个地方是个好主意, 而不是仅仅通过/dev/null丢弃它们。 在进行问题诊断的时候,日志输出是非常宝贵的。不过,日志输出可能很庞大(特别是在比较高的调试级别上), 因此你不会希望无休止地保存它们。
1240 0
|
关系型数据库 数据库 PostgreSQL
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 24 章 日常数据库维护工作
第 24 章 日常数据库维护工作 目录 24.1. 日常清理 24.1.1. 清理的基础知识 24.1.2. 恢复磁盘空间 24.1.3. 更新规划器统计信息 24.1.4. 更新可见性映射 24.1.5. 防止事务 ID 回卷失败 24.1.6. 自动清理后台进程 24.2. 日常重建索引 24.3. 日志文件维护 和任何数据库软件一样,PostgreSQL需要定期执行特定的任务来达到最优的性能。
1358 0
|
监控 关系型数据库 数据库
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 28 章 监控数据库活动_28.5. 动态追踪
28.5. 动态追踪 28.5.1. 动态追踪的编译 28.5.2. 内建探针 28.5.3. 使用探针 28.5.4. 定义新探针 PostgreSQL提供了功能来支持数据库服务器的动态追踪。
1360 0
|
监控 关系型数据库 数据库
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 28 章 监控数据库活动_28.4. 进度报告
28.4. 进度报告 28.4.1. VACUUM进度报告 PostgreSQL能够在命令执行期间报告某些命令的进度。目前,唯一支持 进度报告的命令是VACUUM。未来可能会添加更多命令支持。
1269 0
|
存储 关系型数据库 PostgreSQL
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 23 章 本地化
第 23 章 本地化 目录 23.1. 区域支持 23.1.1. 概述 23.1.2. 行为 23.1.3. 问题 23.2. 排序规则支持 23.2.1. 概念 23.2.2. 管理排序规则 23.3. 字符集支持 23.3.1. 被支持的字符集 23.3.2. 设置字符集 23.3.3. 服务器和客户端之间的自动字符集转换 23.3.4. 进一步阅读 本章从管理员的角度描述可用的本地化特性。
1207 0