SLS告警内置通知渠道最佳实践

概述

为了实现全方位、多层次的告警通知,SLS告警内置了多种通知渠道,从触达强度、通知内容丰富程度等方面进行了全方位的覆盖。大体上来说,这些通知渠道分为以下三大类:

  • 用户相关:短信、语音、邮件
  • Webhook相关:钉钉、企业微信、飞书、Slack以及其它通用Webhook
  • 其它:阿里云消息中心


本文会详细介绍各个渠道的一些特点以及限制,并给出一般场景下的最佳实践。

渠道介绍

SLS告警内置通知渠道的一些比较如下表所示:

分类

通知渠道

触达强度

内容丰富程度

限制及建议

用户相关

短信

较强

简单

  • 有字数限制,通常在200字以内
  • 建议只发送简短、必要的信息
  • 避免在短信中加入超链接等内容,不然容易导致内容过长被截断

语音

简单

  • 有字数限制,通常在200字以内
  • 建议只发送简短、必要的信息
  • 建议用来发送严重的告警通知,对于低级别的告警避免语音打扰
  • 由于语音的特殊性,因此尽可能避免各种特殊字符或无意义的英文单词

邮件

较弱

丰富

  • 可以发送较长信息,适合发送告警详情
  • 内容中支持基础的 HTML 标签

Webhook相关

钉钉

较强

丰富

  • 内容支持较长信息,适合发送告警详情
  • 钉钉还支持@某个人或者@所有人
  • 支持Markdown内容,可以添加各种超链接,方便进一步查看和操作

企业微信

较强

丰富

飞书

较强

丰富

Slack

较强

丰富

通用Webhook

未知

丰富

  • 通常用来对接企业内部 IM 系统或者内部运维管理平台
  • 具体行为取决于自建服务的业务逻辑

其它

消息中心

一般

  • 触达性较弱,一般用的不多

最佳实践

根据上面的表格,我们可以发现,一般来说,不同的渠道适合不同的发送内容,因此根据实际需求,选取合适的通知渠道,或者使用多种通知渠道相结合,是非常有必要的。

通常来说,会多种渠道结合使用,并且会在行动策略中针对每种渠道配置单独的接收人(用户、用户组或者值班组)、接收时段(不限制、工作日、工作时间等),从而形成多层次的通知,不仅可以快速感知到告警,而且可以根据需要查看详细的内容。

例如:

  • 严重的告警需要直接打电话,并且不管是否是工作时间——强触达,通知内容简单
  • 所有告警都可以直接通过钉钉和短信通知——触达比语音弱一些,但是可以查看详细内容
  • 在有需要的场景下,可以使用值班组来进行负责人的轮换

SLS告警内置通知渠道最佳实践

进一步参考

更多相关信息,可以参考:

对我们工作感兴趣的,可以通过如下方式了解更多,谢谢关注!

SLS告警内置通知渠道最佳实践

上一篇:[MySQL Reference Manual] 7 备份和恢复


下一篇:SLS告警最佳实践——自定义分析告警历史