UNIX Linux系统管理技术入门手册:监视系统、 故障诊断、 维护本地文档、时刻警惕系统安全
监视系统
大型的部署环境需要时刻进行监视。除非事态严重,否则不要指望用户向系统管理员报告问题。比起花时间写说明报告问题,绕过问题通常要快得多,所以用户往往怎么省事怎么来。
定期做检查,确保电子邮件和Web服务正确运行;查看日志文件,掌握故障出现的早期迹象;确保本地网络都连接正确;监视系统资源(例如磁盘空间)的可用性。所有这些工作都很有可能自动执行,各种各样现成的监视系统能够帮助系统管理员完成这项任务。
故障诊断
系统发生故障在所难免。充当技工来诊断故障,在必要时请来专家排除故障等,都成了管理员的工作职责。找出问题往往比修复难上十倍。
维护本地文档
系统为适合单位的需要而逐渐改造,随着改造的进行,该系统便开始变得和文档当初所描述的那个基本系统不一样。既然系统管理员负责做这些定制工作,那么写文档讲清楚变化也是管理员的职责。这项职责包括把电缆的走线位置、电缆连接方式等信息写入文档,保留所有硬件的维护记录,记录备份的状态,编写本地处理过程和策略的文档等。参考32.5节来了解有关文档的建议。
时刻警惕系统安全
系统管理员必须实施某种安全策略,并且做定期检查,确保系统安全没有受到侵害。在安全要求低的系统上,这项工作任务可能仅仅包括对非授权访问进行粗略的检查。在安全要求高的系统上,这可能包括仔细布置由陷阱和审计程序构建的监视网