CLB日志核心的玩法你Get到了吗?

CLB日志类型

CLB日志还有类型?当然CLB维护着千亿QPS的网关产品,精细化运营管理还是很齐全的。

健康检查日志

需求场景:

  • 异常判断,是RS异常/还是CLB异常?这个问题经常性的出现在售后工单里,以前用户侧判断RS异常缺少有效手段,那么现在通过配置健康检查日志 To CLS可以完美解决;
  • 时效性差,需要工单/服务群确认问题,影响不可控。

接入流程:

一键开启,参考配置健康检查日志

如上选择对应CLB实例即可,开启投递,生效时间5-10分钟。

日志字段说明:

日志字段说明,参考如下:

实际到CLS检索到的日志情况如下:

可以发现,无需配置索引,即可被检索到,CLB投递日志的时候已开启索引。

CLB健康检查日志说明:

  • 腾讯云CLB健康检查日志是跳变日志,即只有状态变更才会才生日志,不会持续刷日志,避免产生不必要的重复信息;
  • 状态变更是指,RS状态检查正常和检查异常了;
  • 每个RS异常状态变更,会产生数条探测日志(因CLB是集群,包含多台LD节点,因集群大小,产生的条数略有差异);
  • 支持应用型负载均衡类型,支持TCP/UDP/http(s)监听器。

添加告警:

快速添加告警

通过CLS检索页面,输入需要的SQL语句,通过快速添加告警,即可跳转到新建告警策略页面:

SQL语句如:status:DEAD | select count(*) as clb_hb_lose_cnt

新建告警策略

填写告警名称/触发条件/测试监控任务(测试监控任务是CLS 2021.8月新发布功能)

选择告警频率/选择通知渠道/同时支持多维分析(多维分析是CLS 2021.08新发布功能)

其中通过多维分析,可以将告警内容丰富,如字段top,聚合某个字段当时的统计值等等。

告警时效:

如下:日志产生时间是08:48:25,到CLS的时间是08:48:32,7s左右的延迟。

告警时间如下:08:49:28被触发,56s左右延迟(因告警SQL每分钟执行1次,可能时间会更短,和告警SQL拉起时间有关)

异常复盘场景:

如查看某RS的具体异常和恢复时间点。

操作日志

需求场景:

  • 及时发现线上变更(如xxx时间xxx人调整了xxx实例的权重);
  • 核心变更监测(如CLB 特殊化配置);
  • 审计日志,安全需求等。

接入流程:

CLB操作日志是自动上报到云审计,只需开通云审计跟踪集,投递到CLS,就可以利用CLS的检索/SQL/告警/Dashboard的能力。(目前云审计日志已支持投递CLS,提工单申请开通即可)

操作日志详情:

如下:因日志字段过多,只显示部分日志字段,如操作账号/时间/资源类型/事件名称等。

操作日志应用实践场景:

  • 监测线上CLB实例RS权重被修改

对应检索语句如下:

resourceType:"clb" AND actionType:"Write" AND eventName:"ModifyTargetWeight"

  • 监测负载均衡维度的个性化配置操作

对应检索语句如下:

resourceType:"clb" AND actionType:"Write" AND eventName:"SetCustomizedConfigForLoadBalancer"

  • 监测非办公网IP的操作

对应的检索语句如下:

resourceType:"clb" AND actionType:"Write" NOT sourceIPAddress:"117.111.119.45"

event类型:

目前CLB支持近百种类型event,可以参考CLB API接口的输入参数的Action。

如下所示:

告警分析:

告警分析的能力参考如上健康检查日志/访问日志,以及最近CLS更新了N种新SQL满足不同场景。

更多好玩的/有意义的日志玩法,欢迎分享交流。

本站文章资源均来源自网络,除非特别声明,否则均不代表站方观点,并仅供查阅,不作为任何参考依据!
如有侵权请及时跟我们联系,本站将及时删除!
如遇版权问题,请查看 本站版权声明
THE END
分享
二维码
海报
CLB日志核心的玩法你Get到了吗?
CLB日志还有类型?当然CLB维护着千亿QPS的网关产品,精细化运营管理还是很齐全的。
<<上一篇
下一篇>>