博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
kubernetes 集群_使用Kuberhealthy进行综合Kubernetes集群监控
阅读量:2526 次
发布时间:2019-05-11

本文共 830 字,大约阅读时间需要 2 分钟。

kubernetes 集群

在生产中运行集群是一项任务,其中包含许多活动部件。 密切关注所有这些不同部分并非易事。 更糟糕的是,Kubernetes分布很广,并且经常自我修复。 如果集群中出现问题,则可能是断断续续的(或足够具体的),以致在很长一段时间内都不会出现损坏。 当然,在这段时间内,您的客户或开发人员的体验可能会下降或完全崩溃。

可能长期未引起注意的一些偷偷摸摸的事情的例子:

  • CNI代理程式当机
  • 由于节点上托管的嘈杂的Pod导致速率限制,导致节点被API服务器阻止
  • Kubelet间歇性崩溃
  • 间歇性Kubernetes API连接问题
  • kube-dns或CoreDNS的单容器故障

传统的指标和警报不足以准确地识别这些类型的故障情况,但是这些问题会导致Pod不能安排时间,滚动更新挂起,DNS查询被错误回答,流量无法正确地负载均衡以及许多很多更糟糕的事情。 显然,需要额外的监视源,以深入了解Kubernetes的功能,以清晰呈现集群的运行状况。

Comcast创建和使用的开源项目使Kubernetes的变得更加容易。 Kuberhealthy除其他外,每15分钟对群集进行一次检查,以确保每个节点都可以在可接受的时间内正确部署和拆除Pod。 这个简单的测试可确保集群调度程序,Kubernetes API和CNI设置功能正常运行。

这些检查的结果可以轻松地作为Prometheus度量标准提供或监视,也可以通过刮刮Kuberhealthy提供的简单JSON状态页面来进行。 Kuberhealthy的中提供了更多设置详细信息和检查信息。

由于Kubernetes及其服务具有自我修复和分布式的特性,因此生产Kubernetes集群中的许多问题很可能在很长一段时间内都未被发现和未知。 通过启用一些简单的综合检查,我们有更好的机会在客户或开发人员注意到之前,在我们的基础架构中捕获此类短暂的和范围有限的干扰。

翻译自:

kubernetes 集群

转载地址:http://rtszd.baihongyu.com/

你可能感兴趣的文章
My安卓知识6--关于把项目从androidstudio工程转成eclipse工程并导成jar包
查看>>
旧的起点(开园说明)
查看>>
生产订单“生产线别”带入生产入库单
查看>>
crontab导致磁盘空间满问题的解决
查看>>
java基础 第十一章(多态、抽象类、接口、包装类、String)
查看>>
Hadoop 服务器配置的副本数量 管不了客户端
查看>>
欧建新之死
查看>>
自定义滚动条
查看>>
APP开发手记01(app与web的困惑)
查看>>
笛卡尔遗传规划Cartesian Genetic Programming (CGP)简单理解(1)
查看>>
mysql 日期时间运算函数(转)
查看>>
初识前端作业1
查看>>
为啥程序会有bug?
查看>>
跨域技术
查看>>
JS里的居民们7-对象和数组转换
查看>>
计算两个日期的时间间隔,返回的是时间间隔的日期差的绝对值.
查看>>
python初体验
查看>>
配置vue,vue脚手架的应用(老版本)
查看>>
linux下防火墙iptables原理及使用
查看>>
经典C面试真题精讲
查看>>