Q/GDW 11545-2016 信息系统检修作业规程.pdf

  • Q/GDW 11545-2016  信息系统检修作业规程.pdf为pdf格式
  • 文件大小:28.6 M
  • 下载速度:极速
  • 文件评级
  • 更新时间:2021-06-24
  • 发 布 人: 13648167612
  • 原始文件下载:
  • 立即下载

  • 文档部分内容预览:
  • 信息系统检修作业的安全要求如下: a)若信息系统检修存在业务数据不可用(损坏、丢失)的风险,则应在检修操作前对业务数据进 行备份; b 应加强工作班成员信息安全管理,与关键岗位员工尤其是外部单位人员签订保密协议,明确信 息安全保密的内容和职责; c) 信息系统运维帐号应由运维单位管理,确需厂商人员提供现场支持服务的,应履行一事一授权 且使用部门与运维单位应现场监督,确保操作过程可追溯: d)重大检修应编写相应的应急预案和针对检修不同阶段的回退方案,宜联系厂商技术人员现场技 术支持或远程技术支持。

    5.5.1工作票签发人职责包括

    联轴器标准a)负责工作票签发环节; b)审核检修作业的必要性和安全性; c)审核工作票所列检修工作内容、工作条件、安全措施等信息是否正确完备; d)确认所派工作负责人和工作班成员是否适当和充足

    Q/GDW115452016

    5.5.2工作负责人职责包括:

    5.5.3工作许可人职责包括

    a)负责两票许可环节: b)负责审查工作票所列安全措施是否正确、完备,是否符合现场条件: c)负责核实当前信息系统运行方式是否满足检修作业条件; d)负责监控作业过程中检修相关设备状况。

    5.5.4工作班成员职责包括

    )产格依照网票执行修操作, 服从工作负责人的指挥、指导和监督: b)负责检修相关文档、方案的编制: c)负责信息系统故障抢修执行

    6. 1.1 配置变更

    6.1.1.1设备硬件操作前应佩戴防静电手环或防静电手套,进行静电释放。 6.1.1.2服务器的硬件配置变更(CPU、内存、磁盘容量扩容等)操作前应备份系统重要配置文件乃至 整个操作系统及文件型数据,确保变更操作的可回退性。 6.1.1.3服务器配置变更前后应确认设备运行正常、无硬件告警,确认硬件加载及操作系统各项服务 运行正常。 6.1.1.4涉及集群配置时,应确保相关信息同步,并确认宿主机运行状态正常、集群高可用功能正 常、时钟同步正常、管理网与业务网正常等。 6.1.1.5服务器关闭或重启操作前,应关闭服务器上运行的业务系统及相关服务,确保重要数据不丢

    6.1.2.1系统升级前,应提前在测试环境完成相关功能和性能的测试和验证工作。 6.1.2.2服务器操作系统或固件微码版本变更前应进行系统稳定性测试及与承载业务的兼容性测试, 并备份原操作系统及文件型数据,确保变更操作的可回退性。 6.1.2.3服务器关闭或重启操作前,应关闭服务器上运行的业务系统及相关服务,确保重要数据不丢 失。 6.1.2.4系统升级后,应对操作系统及业务系统进行全面的功能测试及非功能性测试,确保业务运行 正常。

    6. 2. 1 配置变更

    D/GDW115452016

    6.2.1.1设备硬件操作配置前应佩戴防静电手环或防静电手套,进行静电释放。 6.2.1.2应备份网络设备当前的配置及状态信息,确认当前配置已保存,确保变更操作的可回退性。 6.2.1.3重要网络设备的更换、拓扑结构调整、链路调整、核心参数调整等检修应在检修前分析所承 载的业务数据及检修操作引发的数据流变化情况,针对高风险、高难度、高复杂性的步骤制定相应的 处置措施;检修操作应细分为多个子模块,每个模块操作完成后及时进行验证确认,确认正常进入下 模块,不正常则进行分析或回退。 6.2.1.4网络交换机配置变更后,应对生成树配置、双机热备配置、VLAN配置等参数验证,确认配 置变更后,逻辑拓扑状态与预想一致。 6.2.1.5重要参数调整前,应在测试环境验证或采用模拟器进行配置验证;配置调整过程中,应实时 监控参数变化情况,逐步进行验证及记录:调整完成后应进行全面验证。 6.2.1.6参数配置调整应符合公司要求,如参数调整影响上级业务访间或上下级网络互联,则配置调 整方案应征得上级单位认可后方可执行。 6.2.1.7负载均衡配置变更后应检查主备设备配置的同步状态,确认业务系统流量与预期一致。 6.2.1.8网络设备检修操作应依照Q/GDW11414一2015中3.3.1执行。 6.2.1.9涉及网络设备重启操作的检修宜准备相关备品备件,避免重启过程中部分板卡失效

    6.2.2.1版本变更前应进行承载业务的兼容性测试,并备份原版本文件和配置文件,确保变更操作的 可回退性。 6.2.2.2设备重启操作前,应对网络设备所承载业务系统及相关服务进行确认,确保重要数据不丢 失。 6.2.2.3版本升级前,应确认设备存储空间能够容纳新版本,重要网络设备升级宜在本地执行。 6.2.2.4版本升级过程中,应有专人在设备现场配合,并记录升级过程的运行日志,发现异常及时反 馈处置。 6.2.2.5版本升级后,应确认新版本生效,对运行配置、路由协议、承载业务等进行验证, 6.2.2.6版本升级完成后,宜加强设备及所承载业务的监控,组织技术力量保障,确保新版本稳定运 行。

    6.3.1.1配置变更前,应确认存储设备及相关网络处于信息系统常态运行方式,备份配置并确认穴余 设备运行正常。 6.3.1.2配置变更前,应分析检修对设备相关业务系统的影响并通知相关业务管理部门,经业务管理 部门同意后方可开展。 6.3.1.3配置变更过程中,应实时监控设备的运行状态,确认每个步骤与预想一致。 6.3.1.4变更操作完成后应确认存储设备多路径状态、存储配置同步、存储复制,数据备份系统等正 常,备份配置信息。

    册操裸作 6.3.2.2缺陷修复后,验证存 续观察30分钟以上。

    Q/GDW115452016

    Q/GDW115452016

    6.3.3.1应备份配置信息,确认ZONE信息划分模式、端口链路信息与服务器和存储对应关系。 6.3.3.2设备迁移应严格按照方案执行,并确认每个步骤的执行情况。 6.3.3.3设备迁移后应确认业务系统、存储复制、灾备复制等运行正常

    6. 4. 1 配置变更

    6.4.1.1防火墙配置策略应遵循最小安全原则,配置基于IP地址(段)、端口级的拒绝或允许访问的 安全策略,源地址和目的地址的范围应以实际访间需求为前提,尽可能缩小范围。 6.4.1.2安全设备配置变更应详细记录变更原因、检修时间、作业人员、执行结果等,安全策略的存 放和调整应满足公司信息安全保密的相关要求。 6.4.1.3双机热备方式的安全设备进行检修前应确认双机运行状态、配置同步等正常,检修操作后应 再次确认。

    6.4.2.1安全设备应采用运行 发布软件版本, 6.4.2.2版本升级前应备份原版本文件和配置文件, 待备用设备升级完毕,再升级主用设备版本

    7.1.1.1配置变更前,应确认服务器资源满足配置变更要求,并对配置变更的影响进行评估和测试。 7.1.1.2配置变更前,应对数据库参数文件进行备份,根据数据库性能分析报告生成性能基线、设计 调优模型。性能调优操作时,根据性能瓶颈进行实例级和语句级优化。操作后再次进行性能分析,根 居优化前后性能指标比对以判断性能调优的有效性 7.1.1.3创建数据库实例前,确认数据库软件已正确安装、相应的文件系统目录的权限正确配置,操 作系统内核参数配置及性能参数正确设置,确认数据库用户的环境变量正确设置。 7.1.1.4涉及灾备的业务系统数据库节点配置变更前,应评估灾备端数据库服务器是否应做相应变 更;配置变更完成后,应确认灾备状态恢复正常。 7.1.1.5数据库用户的变更,以最小权限原则为每个用户分配角色、系统权限、对象权限,新建用户 的默认表空间不能为数据库系统表空间。

    Q/GDW115452016

    7.1.2.4数据库启动顺序为:先启动灾备端数据库的管理、复制进程,然后再启动生产端的管理, 取和传输进程;停止顺序为:先停止生产端的抽取,传输和管理进程,然后再停止灾备端的管理、 制进程。

    7.1.3.1数据库不能对外提供服务时,应检查数据库实例和监听状态是否正常,检查数据库相关日志 文件及操作记录等,定位故障原因,及时恢复。 7.1.3.2数据丢失时,可采取数据库自身机制(闪回、回滚等)或外部备份(本地备份、灾备)等措施进 亍恢复,恢复正常后,应进行完整备份。 7.1.3.3数据库响应延迟时,应检查当前并发用户量是否突增,检查数据库是否存在大量的锁,确认 当前数据库的等待事件,并查看数据库参数、表空间、索引、SQL语句执行计划等的合理性,定位故 障原因,及时恢复。 7.1.3.4数据库集群异常时,应检查集群节点、网络、权限等的状态是否正常,检查集群节点相关的 日志文件,定位异常原因,及时恢复。

    7.2.1.1参数变更前,应确认服务器资源满足要求,并对中间件域配置文件进行备份,确保操作可回 退。 7.2.1.2中间件部署时,应依据所承载的业务应用规模,对中间件的资源池连接数、内存等关键参数 进行优化,提高系统稳定性。 7.2.1.3配置变更完成后应验证变更配置生效及业务系统运行正常。

    7.2.2.1版本升级前,应提前在测试环境上验证中间件功能,确认服务器资源满足升级需求。 7.2.2.2版本升级前应备份原版本中间件及业务系统软件。 7.2.2.3版本升级后,应验证中间件及业务系统运行情况,确认系统运行正常。

    7.2.3.1中间件控制台无法访问时,如果为集群环境, 管理节点服务后登录。如果为单机环 境,则通过排查应用系统是否部署在管理节点,排查中间件相关日志,定位异常原因,及时恢复。 7.2.3.2中间件响应缓慢时,登录管理控制台,查看堆内存使用情况、线程状态、数据源连接状态 后台日志中的相关信息等,定位异常原因,及时恢复。 7.2.3.3中间件程序异常导致业务系统不可用时,应依照中间件的启停顺序执行重启操作,及时恢 业务系统,后续排查异常原因。

    3.1.1配置变更前,应在测试环境进行测试,并对原配置进行备份

    8.1.1配置变更前,应在测试环境进行测试,并对原配置进行备份

    Q/GDW115452016

    Q/GDW115452016

    3.1.2配置变更前,应全面梳理与其他应用系统的接口,分析变更对其他应用系统的影响:如影响其 他应用系统,应在检修前提前一周将检修相关内容通知相关业务部门。业务部门如有异议应及时反馈意 见 8.1.3配置变更过程中,应及时验证变更的有效性及范围准确性,如涉及其他应用系统,应同时开展 验证工作。 3.1.4配置变更后,应全面验证业务应用系统各项功能及相关接口,确认业务恢复正常:如影响其他

    8.1.2配置变更前,应全面梳理与其他应用系统的接口,分析变更对其他应用系统的影响;如影响其 他应用系统,应在检修前提前一周将检修相关内容通知相关业务部门。业务部门如有异议应及时反馈意 见 8.1.3配置变更过程中,应及时验证变更的有效性及范围准确性,如涉及其他应用系统,应同时开展 验证工作。 8.1.4配置变更后,应全面验证业务应用系统各项功能及相关接口,确认业务恢复正常:如影响其他 应用系统,应同时验证该业务应用系统各项功能及相关接口,确认业务恢复正常。

    8.2.1版本升级前,应在测试环境对系统升级包测试,同时要提前落实组织措施、技术措施、安全措 施和实时方案,提前做好对关键用户、重要系统的影响范围和影响程度的评估,开展故障预想和风险分 析,制定相应的应急预案及回退、恢复机制。 3.2.2版本升级过程中,应指派专人全程监护检修操作,保证升级安全执行。 3.2.3版本升级后,应立即进行自验收,重点针对升级变化内容开展业务测试及相关集成测试,确保 检修质量,并加强业务系统监控及技术保障

    8.2.1版本升级前,应在测试环境对系统升级包测试,同时要提前落实组织措施、技术措施、安全措 施和实时方案,提前做好对关键用户、重要系统的影响范围和影响程度的评估,开展故障预想和风险分 析,制定相应的应急预案及回退、恢复机制。 3.2.2版本升级过程中,应指派专人全程监护检修操作,保证升级安全执行。 8.2.3版本升级后,应立即进行自验收,重点针对升级变化内容开展业务测试及相关集成测试,确保 检修质量,并加强业务系统监控及技术保障

    9.1.1复制进程调整

    9.1.1.1中断进程前,应确认复制进程已将数据变化写入灾备端,即当前复制进程延迟为0。 9.1.1.2复制进程增加,应检查增加的进程映射表与当前已存在的复制进程映射表是否一致,在修 改、参数修改时,注意输入字符大小写、格式等。 9.1.1.3复制进程调整,应确认更改的复制进程同步的数据表与生产端的数据一致性,确保复制进 可用。

    9.1.2数据库初始化

    9.1.2.1初始化应保证生产端数据复制软件抽取进程正常运行,并对生产端数据库进行全库备份,包 括对其数据文件、参数文件、控制文件以及归档日志进行备份。 9.1.2.2数据库备份时,停止其他所有相关进程。 9.1.2.3数据库初始化过程中,应通过SQ语句监控恢复进度。 2.1.2.4数据库初始化后,应创建复制软件指定用户,调整复制进程参数,启动复制进程,追平检修 时间段内产生的数据变化。

    9.1.3文件系统优化

    9.1.3.1根据被灾备端数据库使用的实际情况对文件系统进行调优,测试进程各项功能,确保其在 件系统优化后正常运行。 9.1.3.2应对优化前后数据库的各项指标进行对比,并进行记录

    9.1.4单表数据初始化和修复

    9.1.4.2进程停止后导出所需初始化和修复的数据表,之后导入灾备端。

    9.1.4.3启动数据复制进程,追平灾备端数据。

    9. 1. 5配置变更

    D/GDW11545201

    9.1.5.1参数变更前,应进行参数更改的评估、分析和测试工作,并对调整的参数做好相应的记录,确 保操作的可回退性。 9.1.5.2配置更改完成后,检查生产端和灾备端的相关进程均处于运行状态且复制正常,

    参数变更前,应进行参数更改的评估、分析和测试工作,并对调整的参数做好相应的记录, 的可回退性, 2配置更改完成后,检查生产端和灾备端的相关进程均处于运行状态且复制正常

    9.1.6.1版本升级前应备份生产端和灾备端的数据复制软件及相关配置。 9.1.6.2版本升级过程中,应参照数据复制软件历史参数配置情况,配置生产端和灾备端抽取、投递 和复制进程等参数。

    9.1.6.1版本升级前应备份生产端和灾备端的数据复制软件及相关配置。 9.1.6.2版本升级过程中,应参照数据复制软件历史参数配置情况,配置生产端和灾备端抽取、投 和复制进程等参数。

    9.2.1配置变更前,应通过复制管理软件备份配置参数,确保变更操作的可回退性 9.2.2配置变更完成后,通过生产端及灾备端的管理界面检查存储复制的一致性组处于运行状态且复 制正常,数据为同步状态。 9.2.3由生产端调整数据复制状态:灾备端根据磁盘空间的调整情况变更验证快照配置,同时对变更 操作进行监控

    10.1.1.1机房空调停机检修前应确认备用机房空调工况良好,机房温湿度可达到机房环境要求 10.1.1.2如无空调备用机,应安装临时制冷设施或采取临时制冷措施。 10.1.1.3检修过程中,应加强机房环境的监控,确保温湿度处于正常范围;如温湿度超出正常阀 值,则及时启动相应的应急处置预案。

    10.1.2非停机检修

    10.1.2.1检修过程中应在现场设置明确的检修区域,避免对信息系统设备误碰。 10.1.2.2检修期间应加强机房基础环境及机房内设备的监控,出现异常及时处置

    10.2.1.1检修前应逐个将所带负载切断电源或调整至其他电源上。 10.2.1.2检修操作前应做好相关的安全防护措施,检修工作区域设置围挡及检修标识。 10.2.1.3 检修操作人员应掌握电源设备的运行方式,具备相关的资质和工作经验,并有专人监护 10.2.1.4 恢复送电前应确认接线准确、牢靠,标签标识准确到位,工具等无关物品收拾妥当 10.2.1.5 加电过程中应密切监控电源运行状态,确认各模块、组件运行正常。 10.2.1.6 试运行正常后,逐个将负载切回,观察电源电源、电流变化情况,确保电源三相平衡,且 载量处于正常范围之内。

    10.2.1.1检修前应逐个将所带负载切断电源或调整至其他电源上。 10.2.1.2检修操作前应做好相关的安全防护措施,检修工作区域设置围挡及检修标识。 10.2.1.3 检修操作人员应掌握电源设备的运行方式,具备相关的资质和工作经验,并有专人监护。 10.2.1.4 恢复送电前应确认接线准确、牢靠,标签标识准确到位,工具等无关物品收拾妥当 10.2.1.5 加电过程中应密切监控电源运行状态,确认各模块、组件运行正常。 10.2.1.6 试运行正常后,逐个将负载切回,观察电源电源、电流变化情况,确保电源三相平衡,且负 载量处于正常范围之内。

    Q/GDW115452016

    10.2.2.1检修前应充分分析检修工作的风险点和应对措施,编制应急处置预案,做好相关的安全防护 猎施。 10.2.2.2检修前应确认相关工具的绝缘化情况满足要求,确认工作组成员掌握安全风险点和工作步 骤,设置专人现场监护和提醒。 10.2.2.3检修过程中应实时监控电源运行状态,确保检修操作正确有效

    11.1应依照国家电网安监(2011)2024号的内容对信息系统事故进行定级、报告、调查、记录等。 11.2信息调度发现需要立即进行抢修的信息系统故障或接到此类故障报修后,应根据故障现象进行初 步判断,确定故障影响范围,通知相关运维部门或单位,立即组织开展紧急抢修。 11.3作业人员到达故障现场后,在进行紧急抢修前,应向信息调度申请开工并办理完相关许可手续, 在得到批准后,方可进行抢修操作。 11.4抢修人员应依据收集的故障信息进行初步判断,如信息系统探测告警,则判断信息系统访问地址 异常:如接口运行告警而系统探测正常,则判断接口程序异常等。 11.5在无法直接定位故障的情况下,应组织网络、主机、中间件、数据库等方向工程师同时故障排除, 确保最短时间定位故障。 11.6通过在网络设备上查看路由表及使用网络连通性测试命令判断、定位故障点,通过在主机或服务 器上使用ssh等命令判断服务端口是否可访问。 11.7通过登录服务器及查看CPU、内存、磁盘空间使用情况排查主机、系统性能是否正常。 11.8通过查看数据库监听运行情况、端口状态、磁盘空间、日志等定位数据库故障。 11.9如事故检修过程中需要其他配合,应由工作组成员向信息调度提出申请,信息调度组织,相关信 息调度及单位应给予积极支持配合 11.10信息运行维护检修部门应制定事故抢修专项应急预案和现场处置方案,信息调度应定期组织开 展应急演练 11.11信息运行维护检修部门应配备充足的抢修器材及备品备件,确保抢修过程快速、顺利进行。 11.121 信息运行维护检修部门在接到调度指令后,应积极制定应急抢修方案,并报调度部门审核批准 11.13故障抢修若需要外单位协助时,应做好协助单位的资质审查,并对抢修方案及安全注意事项会 审;抢修时,运行单位负责现场协调、安全管理及质量监督。 11.14故障排除信息系统恢复后,工作组成员应向所属信息调度进行汇报,经确认后,办理峻工许可 手续,方可离开事故抢修现场。 11.15事故抢修结束后,抢修人员应及时将故障原因、处理结果、恢复时间等汇报所属信息调度。信 息调度应确认信息系统恢复情况并通知相关业务部门。 11.16各级信息调度机构应在抢修完成后24小时内提交故障分析报告,并逐级上报,故障分析报告内 容包括故障原因、抢修过程、处理结果、恢复时间和整改措施等。 11.17抢修结束后,应总结经验教训并修订完善相关应急预案。

    Q/GDW115452016

    附录B (规范性附录) 工作票编写格式 信息系统检修工作票编写格式见表B.1。

    表B.1国家电网公司信息系统检修工作票

    污水处理厂标准规范范本Q/GDW115452016

    Q/GDW115452016

    Q/GDW115452016

    本标准依据《国家电网公司关于下达2016年度公司第一批技术标准制修订计划的通知》(国家电网 科(2015)1240号)的要求编写。 随着国家电网公司信息化水平的不断提高及公司业务的高速发展,信息系统在公司的生产、经 营、管理等各个方面发挥着越来越重要的作用。信息系统检修是公司信息系统调度运行体系中的检修 部分,可提高信息系统健康水平,确保信息系统安全稳定运行。目前,信息系统呈现集成关系复杂、 接口多等特点,信息系统检修工作难度也随之增加,驱需建立一套科学、规范的标准用来指导检修作 业操作。 本标准的编制主要目的是为规范信息系统检修作业操作的流程与步骤,提高运维操作的规范化水 平,确保信息系统安全稳定运行。

    本标准根据以下原则编制: 借鉴国家电网公司信息系统调度运行规程、电力通信检修管理规程、电力通信现场标准化作业 规范等,并紧密结合信息系统运维检修对象的分类特点进行编写: ) 根据国家电网公司信息系统检修工作的相关要求,总结检修工作当中的经验教训,进一步规范 检修作业操作的流程和步骤。

    3与其他标准文件的关系

    2016年2月,启动标准编写工作。 2016年3月10日,成立编写组建筑CAD图纸,并召开编写组研讨会,会议制定工作方案,编写计划,任务分 等,形成标准大纲。

    Q/GDW115452016

    本标准按照《国家电网公司技术标准管理办法》(国家电网企管(2014)455号文)的要求编写。 本标准的主要结构和内容如下: 本标准主题章分为8章,由总则,基本要求,硬件平台,系统平台软件,应用系统,基础设施,灾 备系统及事故抢修组成。总则明确了信息系统检修工作的适用范围和基本原则:基本要求从作业人员、 工器具和仪器仪表、检修作业要求、安全要求、职责分工方面对信息系统检修提出了要求;硬件平台、 系统平台软件、应用系统、基础设施及灾备系统是按照信息系统五大类运维检修对象逐个提出检修步骤 及流程的要求;事故抢修主要针对信息系统事故处置的流程及步骤,进行应急预案、抢修方案准备、抢 修汇报等方面的要求。

    ....
  • 相关专题: 信息系统  

相关下载

常用软件