OpenStack企业云平台监控的示例分析

70次阅读
没有评论

共计 2032 个字符,预计需要花费 6 分钟才能阅读完成。

这篇文章主要为大家展示了“OpenStack 企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让丸趣 TV 小编带领大家一起研究并学习一下“OpenStack 企业云平台监控的示例分析”这篇文章吧。

性能监控

对于 OpenStack 云平台,主机、存储和网络的监控需求和传统 IT 环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络 I / O 等。本文对于监控并不会展开说明,这里展示在 OpenStack 部署中使用最多的一款开源软件 Ganglia。

Ganglia 需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia 服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。

图 1 展示了用 Ganglia 来展现一个由 5 节点组成的机群的 Load、内存、CPU 和网络 I / O 的视图,并以时间轴来显示。另外历史数据也被保留和查看。

图 1  Ganglia 的 Overview 界面

图 2 展示了 4 个节点的 Load 视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。

图 2  Ganglia 的聚合视图和节点视图

图 3 是 CPU 详细监控项目。

图 3  Ganglia 的 CPU 监控

图 4 是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。

图 4  Ganglia 监控虚拟机内存

服务与资源监控

Nagios 是在 OpenStack 部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。

图 5 展示了 Nagios 的连接视图,这里 5 个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。

图 5  Nagios 的连接视图

另外,Nagios 可以很容易地与邮件系统和短信平台集成,发送告警信息。

另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由 Nagios 服务提供。

图 6 是 Nagios 的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。

图 6  Nagios 的主机视图

图 7 展示了 Nagios 的服务监控视图。默认的 Nagios 可以监控磁盘、SSH、ping 等系统基本服务,但是 Nagios 对 OpenStack 却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。

图 7  Nagois 的服务监控视图

对于 OpenStack 服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。

消息中间件监控

消息中间件在 OpenStack 云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在 OpenStack 云平台至关重要。

图 8 展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。

图 8  RabbitMQ 的 Overview 视图

图 9 显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。

图 9  RabbitMQ 的连接视图

图 10 展示了消息中间件的通道视图。

图 10 RabbitMQ 的通道视图

图 11 展示了消息中间件的交换(Exchange)视图。

OpenStack 企业云平台监控的示例分析

图 11 RabbitMQ 的交换视图

图 12 展示了消息中间件的队列视图,并包括了统计信息。

OpenStack 企业云平台监控的示例分析
图 12 RabbitMQ 的队列视图

图 13 是管理员视图,可以修改密码、增加用户等。

OpenStack 企业云平台监控的示例分析

图 13 RabbitMQ 的管理员视图

日志分析

OpenStack 云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及 Debug 时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。

LogStash 在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。

图 14 展示了 LogStash 的 Overview 视图,可以看到整个云平台日志产生的数量趋势。

OpenStack 企业云平台监控的示例分析

图 14 LogStash 的 Overview 视图

图 15 展示了 LogStash 收集的 OpenStack 云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。

OpenStack 企业云平台监控的示例分析

图 15 LogStash 的消息视图

图 16 展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash 可以很好地帮助我们实现这些。

OpenStack 企业云平台监控的示例分析

图 16 LogStash 的消息过滤视图

以上是“OpenStack 企业云平台监控的示例分析”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注丸趣 TV 行业资讯频道!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-16发表,共计2032字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)