Q/GDW 11985-2019 信息系统自动化运维导则.pdf

  • Q/GDW 11985-2019  信息系统自动化运维导则.pdf为pdf格式
  • 文件大小:3.7 M
  • 下载速度:极速
  • 文件评级
  • 更新时间:2021-06-26
  • 发 布 人: 13648167612
  • 原始文件下载:
  • 立即下载

  • 文档部分内容预览:
  • 应对资源进行分类管理,划分为硬件资源及软件资源: a 硬件资源应包括机架、主机设备、网络设备、存储设备、安全设备、电源、空调、摄像头、传 感器等: b 软件资源宜划分为以下几类: 1)基础资源:计算资源、存储资源、网络资源、操作系统等; 2)平台资源:数据库、中间件、人工智能组件等; 3)应用资源:应用系统、应用组件、应用接口等

    资源标准化治理要求如下: a)应参照6.2.2实现应用系统、操作系统、中间件等资源的标准化分类; )应按照标准化生产工艺要求实现各类资源的标准化命名、配置。

    6.2.4资源台帐管理

    6. 3. 1基本要求

    脚手架标准规范范本应实现通过各类采集存储工具、策略对硬件、基础、平台、应用等各类软硬件资源数据的自动化 集和自动化存储。

    6.2.2中运维对象的采集数据要求如下: 硬件资源的采集数据应包括设备名称、型号、配置、位置、编码、运行状态、责任人等: 基础资源的采集数据应包括: 1)计算资源的总量、分配量、 使用量、CPU运行状态等信息: 2)存储资源的总量、分配量、 使用量、磁盘运行状态等情况; 3)网络资源的总量、分配量、 网络流量情况等信息:

    6.2.2中运维对象的采集数据要求如下: 硬件资源的采集数据应包括设备名称、型号、配置、位置、编码、运行状态、责任人等; 基础资源的采集数据应包括: 1)计算资源的总量、分配量、 使用量、CPU运行状态等信息: 2)存储资源的总量、分配量、 使用量、磁盘运行状态等情况; 3)网络资源的总量、分配量、网络流量情况等信息:

    Q/GDW119852019

    4)操作系统版本、用户数、端口开放情况、运行日志等信息。 c 平台资源的采集指标应包括: 1)数据库集群状态、实例状态、表空间使用率、会话连接数、数据库运行日志等; 2)中间件服务端口、承载的应用、账号权限、运行日志等信息。 d 应用资源的采集指标应包括应用名称、专职、厂商、通用业务指标、个性业务指标、数据接口、 运行日志等。

    4)操作系统版本、用户数、端口开放情况、运行日志等信息 平台资源的采集指标应包括: 1)数据库集群状态、实例状态、表空间使用率、会话连接数、数据库运行日志等; 2)中间件服务端口、承载的应用、账号权限、运行日志等信息。 应用资源的采集指标应包括应用名称、专职、厂商、通用业务指标、个性业务指标、数据接口、 运行日志等。

    采集方式要求如下: a)可采用有代理采集、无代理采集或自定义插件采集等方式进行数据采集; b) 应具备按需对数据采集频率、采集指标进行设置能力; c) 宜每日采集基础架构数据: d) 宜每5分钟采集应用监控数据; e) 数据采集组件占用设备CPU平均负载不应超过3%; f 数据采集组件占用设备CPU最大负载不应超过10%: 数据采集不应影响原有业务正常运行。

    数据存储要求如下: a) 数据存储时间: 1)性能指标数据宜至少保存半年,超过半年的数据宜归档保存: 2)运行日志数据应至少保存半年,超过半年的数据宜归档保存 b) 数据库选型: 1)基础架构数据宜采用关系型数据库进行存储; 2)具备时间序列特征的监控数据宜采用时序性数据库进行存储。

    应实现运行故障、运行状态、网络流量、性能等自动化运行分析能力和风险预警、预警分级等自 化预警能力。

    应实现以下分析能力: a)运行故障自动化分析,包括自动化故障研判、定位、分类、处置方案匹配、处置方案生成等: 运行状态自动化分析,包括各类资源运行状态自动化巡检,自动分析巡检结果并形成分析报告 及处置建议等: ) 辅助自动化分析,包括: 1)网络流量分析:对各信息系统的网络流量进行自动化统计分析,实现网络流量智能监控 统计; 2) 性能分析:对信息系统全链条进行性能分析,实现性能问题预警、风险点定位等: 3) 数据流转监控分析:实现各业务系统之间的数据流转的及时性、完整性分析,对各信息系 统数据流转状态进行统计、分析。 d) 自定义分析报表生成;

    Q/GDW119852019

    Q/GDW119852019

    e)自动生成拓扑关系,自动生成的拓扑 关系包括网络拓扑、应用系统架构拓扑等。

    预警能力要求如下: a 应实现预警的分级管理,包括紧急预警、严重预警、重要预警、一般预警等: b 应实现风险自动预警,支持设备(系统)投运年限、网络流量、性能指数、关键参数、业务操 作、数据流转等风险预警,形成风险预警报告; C 应实现预警报表自动生成。

    应实现监控巡检、资源部: 业的自动处置和故障应急处 置、故障处置结果验证、检修失败 处理时效性宜参考附录A

    常规作业方面要求如下: a)监控巡检方面应实现: 1)自动化巡检:为各种软硬件资源提供运行指标及合规指标的检查,针对不同的巡检场景和 需求形成定制化的巡检任务,巡检对象涵盖操作系统、数据库、中间件、网络设备、安全 设备、存储设备、应用系统等,实现巡检指标的自动采集、自动分析和巡检报表的自动生 成; 2 弱口令检查:应包括主机、网络、数据库、中间件、应用与服务的的弱口令检查; 3) 实名制检查:信息系统相关运维账号的权限和实名制检查,对不合规项进行提示处理,并 输出检查报告。 资源部署方面应实现: 1)自动化部署:对信息系统运行基础设施等对象的自动化部署,包括对传统架构下物理主机 操作系统、中间件、数据库的安装,虚拟化架构下虚拟资源(如虚拟主机、虚拟网络、虚 拟存储等)的创建等; 2 自动化合规性检查:对存量在线系统的运行指标及合规性指标自动化进行检测,并能根据 检查结果自动形成分析报告: 3) 自动化更新:自动完成系统升级、配置变更等更新操作。 检修管理方面应实现: 1)检修结果自动化验证:实现对检修后的运维对象进行自动化健康性校验,包括运维对象的 运行状态、性能指标、集成关系、拓扑结构、数据接口、账号权限等; 2) 标准检修流程自动化:应实现部分标准检修流程自动化,如检修管理工作中检修时长评估, 应急处置方案生成等。 安全管理方面应实现: 配置自动备份:实现安全设备配置文件、配置参数自动备份; 2) 策略批量分发:实现IDS、IPS、WAF、漏洞扫描、防火墙、隔离装置等安全设备策略的批 量分发; 3) 特征库自动升级:实现IDS、IPS、WAF、漏洞扫描、防火墙、隔离装置等安全设备特征库 升级信息自动获取及升级:

    Q/GDW119852019

    4)策略分析:实现安全设备策略到期预警、自动去重和合规性分析等; 5)补丁自动更新:实现操作系统、中间件、数据库等软件版本的统一管理及补丁自动更新 e 备份管理方面应实现: 1 备份策略自动化管理:实现多种备份软件策略统一管理,应实现异构备份软件的备份策略 批量修改、统一下发和执行结果监控; 2) 备份自动化数据验证:实现自动化对备份环境和备份文件的有效性进行校验,保证备份数 据的完整性和可用性; 3)备份数据自动化恢复:实现自动化恢复备份数据,提高数据恢复效率

    应实现状态总览、硬件资源总览及详情、基础资源总览及详情、平台资源总览及详情、应用资源总 览及详情的可视化展示,

    a)状态总览: 1) 资源总览应显示硬件资源、基础资源、平台资源、应用资源的总体运行状态等,状态应包 括正常、检修、故障、隐患等; 2) 预警总览应显示各类预警数量实时变化情况; 3 预警种类应包括预警总数、紧急预警、严重预警、重要预警、一般预警等; 4)巡检总览应显示巡检资源统计与巡检任务统计。 b) 硬件资源总览及详情: 1) 资源总览应显示机房、机柜、服务器等资源统计信息,包括当前机房空间统计,各类设备 数量统计等信息; 硬件资源详情应展示机房、机柜、主机设备等资源的详细信息,包括设备型号、设备编码、 设备名称、设备位置、运行状态等。 C 基础资源总览及详情:

    Q/GDW119852019

    1)资源总览应显示计算、存储、网络、安全等资源统计信息,包括当前资源总量,分配量, 剩余量等信息: 2 基础资源详情应展示资源的运行状态数据与资源所支持的业务系统信息,包括操作系统版 本、用户数、端口开放情况、承载的业务系统等。 平台资源总览及详情: 资源总览应显示中间件资源、数据库等资源统计信息,包括当前中间件资源总量、中间件 资源使用量、数据库数量、数据库整体使用量等; 2 平台资源详情应展示中间件资源及数据库资源的运行状态数据,包括中间件的消息缓存大 小、应用个数等,数据库的表空间使用率、缓冲区信息、使用该资源的业务系统名称等。 应用资源总览及详情: 1 资源总览应显示各业务的统计信息,包括业务总数量、正常业务数量、检修业务数量、故 障业务数量、隐患业务数量等: 2)应用资源详情应显示业务的运行状态及所依赖的各种资源,包括用户登录数、在线用户数 所依赖物理设备、操作系统、数据库、交换机等。

    展示方式要求如下: )应支持运行概览及各资源的状态统计图形化展示方式: b)宜支持大屏、电脑桌面、移动终端等多种途径展示方式

    Q/GDW119852019

    附录A (资料性附录) 自动处置实效性要求

    表A.1自动处置时效性要求

    D/GDW 119852019

    信息系统自动化运维导则

    Q/GDW119852019

    编制育京 编制主要原则 3与其他标准文件的关系. 主要工作过程. 标准结构和内容. 条文说明。

    D/GDW 119852019

    本标准据《国家电网公司关于下达2019年度公司第一批技术标准制修订计划的通知》(国家电网科 【2019)191号文)的要求编写。 本标准编制背景是为满足业务和技术发展要求,落实公司“十三五”信息化规划的统一部署,开展 言息系统自动化运维建设工作。推进信息系统运维自动化,是落实公司168发展战略和公司“十三五” 售息化规划的具体举措海绵城市标准规范范本,是实现信息系统运维高质量发展的必由之路,是达到公司信息系统运维核心业 务化自动化的重要基础,是提高运维效率效益的有效保障。 本标准编制主要目的是制定信息系统自动化运维规范,为信息系统自动化运维建设提供指导

    本标准根据以下原则编制: a)本标准遵循公司信息化“十三五”规划; b)本标准本只提出整体性、概括性的要求,不涉及具体某一应用自身功能、性能、实现细节; c)本标准整体设计应符合我国现行有效的法律法规的规定,以及相关技术的国际标准、国家标准 为自动化运维功能和服务的扩展、升级及与其他平台或系统的交互提供良好的基础。

    本标准与相关技术领域的国家现行法律、法规和政策保持一致。 本标准不涉及专利、软件著作权等知识产权问题。 本标准宣贯、实施使用中的保密要求按照《国家电网有限公司技术标准管理办法》执行,没有特殊 要求。 本标准中需要公开的产品、服务的功能指标和产品的性能指标不包含专利,不涉密及公司的商业秘 密、技术秘密、信息安全。

    2019年1月,按照公司技术标准制修订计划,项目启动。 2019年2月,成立编写组,讨论大纲,确定分工,制定计划。 2019年3月,完成标准大纲编写,组织召开大纲研讨会,形成大纲。 2019年6月,完成标准初稿编写。 2019年8月,公司信息与通信标准化专业工作组(TC06)在北京组织专家对标准初稿进行评审并提 出修改意见,编写组按照专家意见进行修改形成征求意见稿。 2019年9月,采用函审方式在国网内部征求意见。 2019年11月,公司信息与通信标准化专业工作组(TC06)在北京组织召开了标准审查会,审查结论 为:审查组经过协商一致,统一修改后报批 2019年11月,根据专家最终审查意见修改形成报批稿

    Q/GDW11985 一2019 本标准按照《国家电网公司技术标准管理办法》(国家电网企管(2018)222号文)的要求编写。 本标准的主要结构和内容如下: 本标准主题章分2章。由总体原则、技术要求组成,

    本标准中 旅游标准,标准化生产工艺要求可参考国网下发的

    ....
  • 相关专题: 信息系统  

相关下载

常用软件