网络日志
 
1923于2007-09-27 22:39
监测Linux系统 10条最佳成功经验
1. 定义所获得的“生产”资源的含义 - 一个服务器,一个应用或一种服务。

  2. 找出满足此生产需求的监测方式。

  3. 执行监测可能性,可以通过手动方式也可以借助开源工具,比如Nagios或其它商业工具。

  4. 定义那些 “损坏、不存在、警惕” (broken/unavailable/on fire) 的含义 - 通常也被称之为 警告、出错、危险 (warn/error/critical)。

  5. 在你的监测系统中执行警报以捕捉这些阈值。

  6. 定义不同的警报级别所对应的处理流程。

  7. 确保你的警报处理流程是与那些提示处理流程相符的。

  8. 为各团队创建角色和责任来分摊与他们工作特性相符的警报、控制和细节操作。聚焦于个人通常意味着为他们的区域提供更好的绩效。

  9. 为你整个系统中的警报、监测协议、角色等指定少数超级用户,以确保他们按照单一蓝本(blueprint)执行。

  10. 如需要,则进行修正、清理和重复。

【阅读(106)】 【评论(0)
引用通告
此项的引用通告 URL 是: http://space.kakadoor.com/1923/Trackback.aspx?postID=2268
评论
发布评论
登录发表
名称:
密码:(游客无须)
您的网络日志 URL(可选):
标题:
评论
验证码:
 换一个:

  
  登录  使用高级评论  
添加表情