31天成为IT服务达人之技能篇硬件维护技能概要
《31天成为IT服务达人》之技能篇硬件维护技能概要
服务器维护技能
服务器硬件作为应用软件部署的基础平台,是基础架构中最为核心的设备。一旦服务器出现故障就会影响业务的正常开展。因此,服务器的运维管理对于企业整个 IT 运维管理来说尤为关键。
如何做好服务器的硬件维护?掌握哪些服务器硬件运维知识或技能?是每个服务器硬件运维人员所要深思的事情。服务器运维人员的工作“包含单不限于”以下列表中内容,不过这些也是服务器硬件运维工程师的典型职责:
- 参与制定服务器应用规划和实施方案;
- 评估各类服务器产品和技术,为 IT 管理、规划者提供有效的数据;
- 检查硬件运行情况,保障硬件的正常运行,及时对发现的硬件报警给予处理。对灰尘较多的服务器设备,定期对设备进行除尘工作;
- 升级硬件微码,必要时升级或者迁移系统、数据(硬件物理层面迁移);
- 对硬件的运行情况进行评估,逐步提高整体硬件的可用性;
- 诊断、定位故障、解决任何硬件相关问题;
针对以上服务器硬件运维工程师的职责,作为一个合格的服务器硬件运维工程师应该具备和掌握以下维护技能或知识:
- 对各厂商服务器家族产品有一定的了解。尤其是当前运维的服务器设备厂商的家族产品需格外关注,这对将来服务器的升级或更新换代提供信息有很好的帮助。
- 具备服务器整体应用规划、部署、上架的能力。这是作为一个服务器硬件运维人员所必须掌握的技能。从机器后端各种连线(网线、电源线、光纤线等)梳理的整洁情况,初步可以判断这名运维人员的整体能力。
- 对需要维护的服务器,从硬件整体把握服务器的构造,深入了解服务器中各个配件的物理位置,这对定位硬件故障非常重要。如: IBM 会提供各类小型机的 Servcie Guide 手册,里面就会对服务器各部件的位置有详细的说明。
- 掌握服务器指示灯的含义及如何处理。
- 具有硬件故障诊断,更换配件的技能。首先是要有效的定位故障问题,只能才能谈得上如何去更换。定位故障的方法有很多种。
存储设备维护技 能
12.2.5.1
磁盘阵列及 NAS 设备维护技术
1
)熟悉磁盘阵列的概念和原理,如应了解 RAID 原理、每个 RAID 级别创建的要求和优缺点,熟悉 LUN 、条带化等概念及原理,路径管理等;
2
)熟悉 RAID 的创建及不同型号磁盘阵列的操作配置方法,如应熟悉常见磁盘阵列的外观和指示灯含义,熟悉不同主机如何去连接磁盘阵列让主机正常使用,热备盘概念及如何设置;
3
)掌握磁盘阵列、 NAS 设备日常维护及监控要点;
4
)掌握磁盘阵列、 NAS 设备的异常与应用的关系,如发现数据库慢是由于磁盘阵列的缓存电池异常导致等;
5
)设备只要运转,就难免发生故障,专业、资深的工程师能够在第一时间定位故障、从而尽快解决故障、减少故障影响时间。应掌握磁盘阵列、 NAS 设备常见配件故障及解决办法,如硬盘故障如何确保数据的安全和新盘的更换;风扇故障如何判断和处理;电源故障如何判和处理;控制器的故障如何判断及处理等。
6
)熟练掌握磁盘阵列、 NAS 设备控制器的 Firmwear 版本和升级操作步骤;
数量掌握磁盘阵列和 NAS 设备的日常变更服务,如依据客户需求对存储现有空间进行调整、对存储现有主机更新映射信息、对存储现有 RAID 方式进行调整、对存储现有热备磁盘进行调整。
8
)熟练掌握磁盘阵列和 NAS 设备的日常巡检,主要检查存储设备的电源状态、风扇状态、硬盘健康状态、系统日志检查等。
12.2.5.2
磁带库维护技术
1
)熟悉磁带库相关的技术,如磁带读写技术、驱动器类型、机械手的特性、磁带规格等;
2
)熟悉常见磁带库的操作面板及特性,能熟练完成磁带库的安装和配置;
3
)能熟练掌握磁带库的配件(驱动器、电源、风扇等)的故障诊断和更换方法;
4
)熟练掌握磁带库的 Firmwear 版本号的特性和升级操作步骤;
5
)熟练掌握磁带库的日常巡检,主要检查磁带库基本信息、运行状态、各部件指示灯、控制面板的可操作性、磁带库的运行环境(温湿度、灰尘、电压等)。
网络设备运维技能
如何做好网络设备的硬件维护?掌握哪些网络运维知识或技能?是每个网络运维人员所要思考的事情。网络运维人员的工作“包含单不限于”以下列表中内容:
对所有的网络系统进行维护管理,如交换机、路由器、防火墙等,做好这些设备的日常维护、保养工作
;
对网络新建、扩容、改造、综合布线等网络建设项目给出设计方案及意见;
对网络的安全情况做出评估,包括安全设备和策略、主动安全管理、安全事件处理、入侵监控和分析等
;
针对网络故障问题进行分析,并及时处理和解决网络中出现的问题。
针对以上网络运维工程师的职责,作为一个合格的网络运维工程师应该具备和掌握以下维护技能或知识:
- 掌握计算机网络原理,具备网络基础知识,了解各种网络协议和网络技术,例如:例如 VOIP 、 Qos 、 ACL 、 HSRP,VPN , MPLS 等;
- 了解网络安全知识,网络安全设备、网络安全策略、网络安全检测、网络安全审计和安全事件处理等;
- 掌握网络安全技术:包括端口、服务漏洞扫描、程序漏洞分析检测、入侵和攻击分析追踪、网站渗透、病毒木马防范等;了解主流网络安全产品(如 fw 、 ids 、 scanner 、 audit 等)的配置及使用;
- 熟练使用网络维护命令方法,具有故障检查及排除能力。会配置主要型号的交换机、路由器、防火墙等设备,同时也了解一些了解主流网络产品,如思科、华为、 H3C 等。